6月21-22日,WOT全球技术创新大会在北京圆满闭幕。本次大会吸引60+来自大模型、多模态、AI Agent、云计算、大数据、架构等领域的讲师、专家们精彩布道,共有800+参会者现场参与。作为有着十余年历史的综合技术大会品牌——WOT全球技术创新大会始终把交付优质内容作为坚守的准则,在大模型、AIGC受到普遍关注的当下,大会始终追踪最新、最火热、最优质的内容和技术趋势,在大模型、AIGC赛道持续狂奔。
技术成就梦想
在大会致辞中,51CTO副总裁、数字化转型与技术力研究院院长杨文飞表示:数字时代,以AI为代表的数字技术成为改变世界的革命性力量,基于数字技术的创新成为决定企业生存的核心动力,而人才则是支撑创新的关键因素。数据显示,我国数字化专业人才缺口持续扩大,而数字化技术的半衰期却在快速下降、岗位所需要的技能数量持续增加。可以说,数字技术人才的培养,已经成了决定数字产业发展的重要因素。
十九年来,51CTO始终坚持“技术成就梦想”的理念,致力于把技术进步的价值传播给每个企业和个人,帮助一亿数字化人才终身成长。到目前为止,51CTO已经累计培养超过800万名数字化人才,每年为数千家企业提供数字化人才咨询、培养和认证服务,成为中国数字化专业人才培养的主力军。
迈入智能信息获取新时代
中国人民大学高瓴人工智能学院副院长窦志成带来《生成式信息检索:迈入智能信息获取新时代》的分享。
上世纪90年代开始,以“搜索引擎”为代表的信息检索技术极大地提升了人类从海量互联网数据中获取信息的效率,成为日常生活中不可或缺的工具。而近期出现的以ChatGPT为代表的生成式大语言模型则有望深刻改变人们获取信息的方式,促进信息获取技术的更新升级,进而可能会改变或者替代掉传统搜索引擎。在此背景下,生成式信息检索(Generative Information Retrieval,GenIR)得到了学术界和工业界的广泛关注。
在分享中,窦志成详细介绍了中国人民大学高瓴人工智能学院在生成式信息检索领域开展的部分工作,包括面向信息检索的大模型、生成式文档检索、以及检索增强的生成,并探讨未来发展方向。
用AI驱动增长
火山引擎大模型服务算法负责人王科带来《火山引擎大模型服务,用AI驱动增长》的分享。
王科指出,只有大的使用量,才能打磨出好模型。在字节跳动内部,豆包大模型的实践极为丰富,截止今年4月,豆包大模型日均处理1,200亿 tokens 文本、生成3,000万张图片。豆包App、猫箱、扣子、即梦Dreamina等都是字节跳动内部基于豆包大模型孵化的孵化的产品。这些丰富的使用场景为底座模型——豆包大模型带来了正向循环效果。
通过字节跳动内部50+业务场景实践验证,每日千亿级tokens大使用量持续打磨,豆包大模型以优质的模型效果为企业打造丰富的业务体验。豆包大模型家族包括:豆包通用模型pro、豆包通用模型lite、豆包·角色扮演模型、豆包·语音合成模型、豆包·声音复刻模型、豆包·语音识别模型、豆包·文生图模型、豆包·Function call模型、豆包·向量化模型。
此外,火山引擎推出的火山方舟一站式大模型服务平台,既具备强大的系统承载力,能够保障业务稳定和成本可控性;同时配有全周期安全可信方案,为企业AI应用保驾护航;同时,火山方舟提供了抖音头条同款的联网插件、头条抖音同源的内容插件以及RAG知识库插件,并由字节跳动算法团队提供专业服务,助力企业AI应用轻松落地。
激发企业新质生产力
腾讯云数据库产品总监刘迪带来《云原生数据库全面拥抱AI,激发企业新质生产力》的分享。
随着数字化转型深入,云数据库大规模运营下的可用性、成本和运营效率方面面临着新的难题,数据库也演进为以存算分离、资源预测、异常自愈、故障预测等为特点的“软件+硬件+AI”三位一体的构建方式。
软件方面,腾讯云持续在自研内核 TXSQL 上不断探索和迭代 ,TXSQL 内核100%兼容原生 MySQL ,同时针对游戏、教育、金融、工业制造等行业的通用场景,研发出众多匹配的新特性, 并在数据库领域的国际顶尖学术会议 SIGMOD 中发表了多篇前沿研究成果,也向官方社区贡献了众多内核的新特性和 Bug 修复。
硬件方面,提出了全链路RDMA网络、编译器优化、三层解耦框架、基于持久化内存的二级缓存等“软件优化与新硬件结合”的方法,优化了关键路径性能。
AI方面,腾讯云基于深度强化学习等AI方法并结合专家经验,推出了端到端一站式参数调优服务,无需人为介入,可以根据场景自动探索优化参数,大幅缩短调优时间。此外,还构建了实时的多场景、多维度的智能异常分析能力,能够秒级发现异常,异常处理时间较人工大幅缩减80%。在Serverless 架构上, 打造 AI4DB 服务,形成「AI云原生」产品矩阵等方面迭代。
值得一提的是,腾讯云数据库TDSQL以同类架构1/3的单元成本达到了创纪录的8.14亿的tpmC,同时在性能和性价比方面登顶TPC-C测试榜首。
经过“软件+硬件+AI”三位一体全面优化融合、提升和创新,腾讯云数据库TDSQL的解决方案也带来了更为极致的场景体验。以瑞幸咖啡的实践为例,TDSQL-C帮助瑞幸实现了零替换改造成本的云原生架构升级,可灵活应对10倍的销售流量洪峰,同时节省了大量资源和运维成本。
大模型加速人工智能与产业数字化融合
百度智能云AI与大模型平台总经理忻舟带来《大模型加速产业智能化转型》的分享。
人工智能近年迎来大模型发展的窗口期,超大规模训练数据、复杂的深层模型和分布式并行训练,造就了这一正在崛起的变革力量。与此同时,基于大模型的AI原生应用开发模式也在不断演化,从一开始的提示词工程、RAG,到Copilot,再到爆火的Agent。
对此忻舟表示,我们需要甄别模型对于业务场景适用性,根据具体情况综合选择合适的应用开发模式。
他在分享中表示,百度智能云千帆大模型平台致力于打造大模型服务超级工厂,提供先进的生成式AI生产及应用全流程开发工具链,该平台已经累计有120000+用户、20000+累计模型精调、420000+千帆应用开发数。
作为百度智能云推出的产业级AI原生应用开发平台,千帆AppBuilder致力于打通大模型到业务的最后一公里。同时,基于百度技术积累和自有业务沉淀,百度智能云千帆大模型平台构建了丰富的大模型能力组件、AI能力组件、百度自有业务组件等。
百川智能的AGI之路实践
百川技术联合创始人谢剑带来了关于《百川大模型技术与应用实践》的主题分享。
谢剑提到,2023年6月至2024年5月期间,百川发布了12款大型语言模型。其中,包括Baichuan-7B和Baichuan-13B在内的开源模型Huggingface总下载量超700万次;多个版本中,相较Baichuan 3,Baichuan 4能力全面提升,在SuperClue 4月份基准评测中,Baichuan 4在国内大模型中综合排名第一。
除了致力于提升大模型性能之外,百川在Agent技术领域同样进行了深入探索。百川推出的AI助手“百小应”“懂”搜索、“会”提问:一方面得益于专业的搜索技能,可以通过定向搜索、多轮搜索等方式逐步深入,逼近问题的核心答案,同时结构化呈现搜索结果,优化信息布局;另一方面又能够引导用户清晰表达自身需求并精准定位问题。
面向未来,谢剑认为,技术发展值得关注的几个重要趋势包括大参数/窗口的扩展、多模态和实时自然交互、普惠性、长程任务规划和完成能力以及自学习和进化。
结束语
除主会场分享外,本届大会另外设置了13场平行分会场活动。从百度、阿里、腾讯、字节…等大模型技术大厂,到百川智能、第四范式、商汤科技…等大模型独角兽,本届WOT技术大会邀请了众多大模型企业进行自身实践的集中展示。
分会场、展区热况
一场综合技术大会,虽然需要大模型、多模态、AI Agent这样的热门技术话题,但是同样需要研发效能提升、架构演进、大数据、技术领导力、大前端这样技术人持续关注的话题。在本届WOT技术大会上,我们邀请京东、51Talk、作业帮、方正证券、阅文集团等企业专家,持续带来精彩分享。
腾讯云专场现场
虽然2天精彩大会已经闭幕,但是持续追踪热门技术趋势的脚步不会停止,更多精彩,敬请期待。