30|2024年度技术热词来袭
你好,这里是极客头条。
12 月 13 日至 14 日,由极客邦旗下 InfoQ 中国倾力打造的 AICon 2024(北京站),在工业和信息化部电子第五研究所及北京经济技术开发区的大力支持下成功举办,为与会者呈现了一场高质量的 AI 技术盛宴。
会上回顾了本年度的技术热词,并邀请了一众业内专家探讨技术趋势,分享观点。以下是正文。
年底技术热词回顾
- 生成式 AI 与细分方向关注增加:大模型相关资讯仍是热门,但 RAG、Agent 等细分方向的实践逐步吸引更多目光。
- 数据相关话题热度上升:数据治理、标注、生成等话题在下半年明显升温,相关领域头部企业表现亮眼。
- 推理技术的企业化应用:随着生成式 AI 逐步走向企业级应用,推理环节成为讨论热点。
- 多模态技术演进吸引讨论:OpenAI 连续 12 天直播和谷歌的技术“反击”等事件引发了社区的广泛关注。
- 算力讨论升温:GPU 和异构计算在三季度的讨论热度显著提升,反映了 AI 对算力需求的持续增长。
- 安全话题关注度提升:尽管安全相关文章数量有限,但垂直用户群体的参与度提升,CXO 群体也开始关注这一领域的重要性。
阿里国际算法负责人骆卫华博士——大模型可控生成的探索与思考

骆卫华老师提到:现有大模型更像“铁杵”,能用但不够好用,实现可控生成的大模型将成为“绣花针”,从而解决落地应用的“最后一公里”问题。
他强调,当前大模型在文本生成领域的核心技术挑战包括:如何平衡指令遵循能力与生成质量、多控制条件之间的相互干扰,以及控制条件覆盖不足导致的泛化能力局限。
在图像生成方面,现有方法面临训练成本高、控制精度不足,以及对复杂控制条件适配能力有限等问题,这些技术瓶颈显著制约了大模型在复杂场景中的实际应用。
针对这些挑战,骆卫华分享了阿里国际团队在可控生成技术上的创新成果。在文本生成方面,他们探索了 Model-free 的自适应属性感知框架,通过动态调整模型参数和优化损失函数,成功实现了长度、情感、关键词等多维度生成控制上的突破。在图像生成方面,他们设计了基于 SD 和 MM-DiT 的统一可控框架,引入统一可控的 adapter,显著提升了复杂任务的生成效果,并在多项基准测试中达到行业领先水平(SOTA)。
骆卫华表示,可控生成技术将在媒体、娱乐、电商、金融等行业产生规模化的行业应用,推动大模型的商业化价值落地。
英博数科 CTO 李少鹏——智算未来:探索低成本、高效益的智能算力服务之道

随着通用大模型和垂直领域大模型应用的快速推进,对训练与推理的算力需求持续增长,但高昂的算力成本已成为行业发展的主要瓶颈。
英博数科 CTO 李少鹏深入解析了当前算力服务的核心难题:
- 高算力成本:算力成本主要来自设备采购、机电支持和运维费用。
- 低算力利用率:算力资源的实际利用率普遍偏低,这与硬件匹配、调度策略以及训推框架配置等因素密切相关。
为解决这些痛点,英博数科提出了“单位有效算力成本”的评价标准,用于衡量算力服务质量,并为服务供应商和用户提供科学的决策依据。此外,李少鹏还分享了英博数科的创新实践,包括:
- 构建标准化、模块化的智算中心
- 自主研发高性能并行存储
- 打造智能算力调度平台
- 推出弹性容器服务
这些举措显著提升了算力利用效率,降低了单位有效算力成本,为行业树立了高质量算力服务的标杆。
李少鹏强调,随着长尾客户逐渐成为算力服务的主要消费群体,弹性算力服务将成为他们的首选,推动智能算力行业向高效、低成本的新阶段迈进。
360 智脑总裁张向征——大模型安全研究与实践

聚焦于大模型技术的安全挑战与应对策略,360 智脑总裁张向征分享当前大模型在实际应用中面临的核心安全问题,并针对这些问题总结了解决方案与实践经验。
张向征指出,大模型在训练、推理和应用过程中涉及多个安全风险,这些风险覆盖了模型的整个生命周期,包括数据泄露、模型窃取、提示注入以及记忆投毒等。他特别强调,大模型软件生态的复杂性也使得安全问题更加多样化,例如漏洞利用、恶意代码注入和 SQL 注入,这些都为企业应用大模型增加了隐患。
在生成内容方面,大模型可能因缺乏有效的内容过滤机制而生成涉政、暴力或错误信息,带来伦理与法律风险。同时,其深入阐述了大模型中的“事实性幻觉”和“忠实性幻觉”问题,并分享了通过引入外部知识库(RAG 方案)和强化学习等手段缓解幻觉的实践成果。
在安全防护体系的建设方面,张向征提出了“大模型检、防、攻、测”的全链路安全框架,从安全检测、攻击模拟到策略优化,覆盖了大模型安全管理的各个阶段。通过安全检测大模型、红队攻击以及安全微调等技术手段,可以增强模型的内容安全性,保护输入输出数据的完整性与可靠性。
张向征强调,大模型的安全问题不仅仅是技术难题,更关系到企业业务的安全性和社会责任。未来业界还需要进一步加强原生安全增强、内容安全护栏的建设,以及针对特定行业领域提出更精准的安全解决方案,以确保大模型的可信性与实用性。
腾讯云数据库副总经理罗云——AI 时代下,数据库技术与智能化应用的协同发展

大模型时代的核心在于将企业数据接入 AI,充分释放数据的价值。然而,传统数据库架构在应对大模型海量数据和多样化应用需求时,已暴露出明显的局限性。
腾讯云数据库副总经理罗云分享了大模型时代数据库技术的创新方向与行业实践。他指出,向量数据库是企业数据接入大模型的核心枢纽,能够高效管理非结构化数据与结构化数据的协同处理,成为驱动大模型应用的关键技术之一。
罗云详细介绍了向量数据库在腾讯云的技术演进历程,从 VDB 1.0 到 VDB 2.0 架构的优化升级,涵盖 GPU/CPU 支持、自动分区与索引提升等技术创新,显著增强了数据处理性能。他还分享了腾讯云在向量数据库与 RAG(Retrieval-Augmented Generation)方案的集成实践,这一结合使自然语言查询的召回率提升至 80% 以上。此外,他重点介绍了腾讯云的 ChatDB,这是一种 AI 驱动的智能数据库运维解决方案,通过简化数据库管理流程,加速了企业智能化转型的进程。
展望未来,罗云认为,大模型将引领数据库技术的下一次重大变革,使数据库从传统的数据存储工具进化为智能化数据管理平台,为企业的数字化升级提供更强有力的支持。
产品战略专家梁宁——从商业与关系的本源出发,寻找 AI+ 产品的黄金场景

本次大会特别邀请了产品战略专家、《真需求》作者梁宁,探讨了AI时代背景下的产品战略与商业模式。梁宁指出,我们的时代是由基础设施划定的。从蒸汽到电力再到互联网,基础设施的演化迭代,为社会提供了新能力和新效率,也造就了每个时代的“万物生”。
当下,我们正处在智能革命的前夜,所有人都是“摸着AI过河”,想要看清脚下的路,首先要理解我们身处的时空坐标。不管是评估一个产品、一项业务,还是一个时代,都可以用价值、模式、共识这个极简模型来进行思考。工业时代,效率是企业竞争的核心;互联网时代,信息的获取和处理能力成为决胜关键,谁能聚集信息量优势,谁就能成为时代的巨头;进入智能时代,AI 在感知和决策系统一致性上的优势,使得决策质量成为新时代的竞争力。但同时,人类选择让渡权利给 AI 意味着接受风险和能力退化,这将是一个漫长的共识过程。
在演讲中,梁宁进一步分析了从传统工业企业到互联网企业再到AI企业的商业模式演化路径。传统企业以运营“货”为核心,互联网企业以运营“人”为中心,而AI企业则需要探索原生商业模式的全新逻辑。这不仅要求深刻理解AI作为决策系统的优势,还需超越简单的“+AI”模式,真正找到能够驱动价值创造的“黄金场景”。这些场景需要兼具业务成熟度、数据成熟度和技术成熟度。她建议创业者专注于高频、重复、标准化的应用场景,找到清晰稳定的付款方,服务真需求,避免在 AI 大模型的车轮下“绣花”。
平凯星辰副总裁刘松——走向 Data+AI:TiDB 面向大语言模型应用构建 All-in-One 的数据库

AI 技术的快速发展对数据库提出了更高的要求,特别是在高扩展性、强一致性和一体化能力方面。随着大模型应用对数据管理的需求不断增加,传统数据库架构已难以以一体化的方式应对海量数据的实时在线处理和复杂分析任务。
平凯星辰副总裁刘松分享道,数据库技术正在从传统的事务处理工具向面向 AI 的智能化数据处理平台转型,而 TiDB 作为一款开源的原生分布式数据库,正是应对这一技术挑战的重要创新。演讲中,他详细介绍了 TiDB 的核心架构和技术优势:
- 存算分离与融合一体化架构:从 NewSQL 到 HTAP 再到云原生,这种分离式架构可以灵活适配不同规模的数据需求,支持从交易处理到复杂大数据分析的多种应用场景,同时降低了企业的数据管理成本。
- AI 时代的创新能力:TiDB 在支持向量搜索、图推理等 AI 功能方面表现突出,TiDB All-in-One 的 GraphRAG 解决方案为大模型的开发和运行提供了可靠的技术基础。
- 国产化适配:平凯星辰推出的国产化数据库产品“平凯数据库”,专为满足国内政策和企业需求设计,已在金融、政企,互联网等多个行业得到广泛应用,为大模型应用提供了国产化的全链路支持。
此外,刘松分享了 TiDB 开源生态的建设成果。作为全球领先的开源数据库,TiDB 已拥有超过 38000 名注册用户和 8000 多家企业用户,形成了庞大且活跃的生态体系。他指出,在 AI 与数据深度融合的时代,像 TiDB 这样的 All-in-One 数据库正在为大模型的开发与应用铺平道路,为企业实现降本增效、提质提效提供了核心支撑。