7月4日-7月7日,2024世界人工智能大会(WAIC)在上海举行,来自国内外的数百款大模型集体亮相,呈现了AI大模型智能涌现、赋能千行百业的生动场景。
在各色技术及应用的创新体验区中,一个具备高度交互能力的多模态机器人引起了人们的注意。它就是来自岩芯数智RockAI,搭载了树莓派5代芯片的“小智”,在极低算力的设备上实现了强大的多模态能力。继年初推出超强性能的Yan1.0云端大模型后,RockAI再次突破了端侧AI“原生无损”门槛,并在这款机器人上部署了此次首发的Yan 1.2大模型。与传统的自动控制机器人不同,小智具备多模态认知能力,能够基于Yan1.2的语音和视觉处理能力,准确理解用户的模糊指令和意图,并据此控制其机械躯体高效完成各类复杂任务。随着这款智能机器人在各种模糊指令下描述“视觉”场景、展现“四步成诗”,一场关于端侧AI的全新想象也铺展开来。
端侧AI通常指在终端设备上直接运行和处理人工智能算法的技术,其优势在于可以直接利用设备的计算能力进行数据处理,不需要将数据发送到云端或服务器进行处理,从而降低对云端计算资源的依赖。且无论网络环境如何都能即时生成响应,确保用户数据安全性的同时,减少了相关算力成本开支。
自去年下半年以来,随着大模型的竞争从技术驱动过渡到市场驱动,端侧AI以其广泛的应用场景备受青睐,开始释放出全新的发展价值。全球范围内各大模型厂商纷纷通过各种技术手段,尝试将大模型在物理意义上融入终端。
但受制于端侧AI落地的算力和功耗等挑战,传统轻量化部署往往均以性能损失为代价。如目前大热的AIPC是把Transformer架构的模型通过量化压缩部署到个人电脑,仅70亿参数的大模型还需要额外定制PC芯片为其提供算力。而此前在微型电脑主板树莓派5上打出“1.89tokens每秒速度运行、支持8K上下文窗口”战绩的Llama3 8B,同样止步于“有损压缩”。压缩后的模型不仅性能大打折扣,还会失去再训练、再学习的能力,成为无法定时更新底层知识的“一次性AI”。
而RockAI此次首发的Yan 1.2大模型,则可以“原生无损”地以6+tokens/s的速度运行于算力仅普通电脑八分之一的树莓派上,并在这个仅有信用卡大小的芯片上实现超强的多模态能力,不仅能“听说读”,还可以识别模糊指令,进行学习、创作及互动。
这一成果,起初是得益于对于大模型基础架构的“破坏式”创新。早在今年1月,RockAI发布了国内首个非Transformer的Yan架构大模型。该架构通过对Attention机制的替换,将计算复杂度降为线性,大幅降低了对算力的需求,用百亿级参数达成千亿参数大模型的性能效果,并且率先实现了在主流消费级CPU等端侧设备上的原生无损运行。
为了实现树莓派等更多更低端设备的无损适配,RockAI基于全新自研的Yan架构,在实验室对人工神经网络最底层的反向传播算法进行挑战,寻找反向传播的更优解尝试,进一步实现Yan模型的降本增效。同时在算法侧,RockAI采用了基于仿生神经元驱动的选择算法,实现了类脑分区激活的工作机制,使大模型可以根据学习的类型和知识的范围分区激活,大幅减少了数据训练量,同时也能有效发挥多模态的潜力。故而,模型迭代到1.2版本,已经可以实现在PC端、手机端、树莓派端和机器人端等设备上的无损运行。
历经了卷参数、卷市场的阶段,大模型当下正集中于一个“卷智能”的时代,因此,让大模型无损跑通更多低算力设备只是第一步,接下来就要思考如何提高端侧大模型的知识密度、智能密度。但RockAI CEO刘凡平还有一个更高的目标,就是在实现通用人工智能的同时,将AI与每个人独特的地方结合在一起,模型具备自主学习能力,让每个设备都拥有个性化的智能。
为了实现这种个性化的通用人工智能,RockAI团队首创了“同步学习”理念,让模型具备像人一样实时学习的能力,在推理的同时进行知识更新和学习,无需像云端大模型一样“返厂”进行再次更新或预训练。从而实时、有效且持续性地提升大模型的智能密度,应对各类个性化场景中出现的问题。
基于神经网络的底层技术创新,RockAI不断尝试寻找反向传播的更优解,试图能更低代价更新神经网络,实现对现有知识体系的快速更新,辅以模型分区激活降低功耗、实现部分更新,使大模型像人类学习一样建立自己独有的知识体系,实现模型的边跑边进化。会上,RockAI展示了“同步学习”的实验室示例,并表示该机制已处于实验室最后验证阶段。
而对于Yan模型在设备端的落地,刘凡平则透露,团队正加紧进行设备端的适配工作,目前已与众多硬件和芯片厂商建立了沟通与合作。
RockAI以Yan架构大模型为核心的技术突破与创新实践,标志着端侧AI正逐步克服技术壁垒,向更广泛的应用场景迈进。不仅是对现有计算范式的挑战与超越,更是对未来智慧生活的前瞻布局。
随着全模态支持+实时人机交互+同步学习的落地,Yan 2.0或将重新定义设备的价值,成为设备的“最强大脑”,真正做到“让世界上每一台设备都拥有自己的智能”。
汉王大健康携柯氏音电子血压计亮相
2024世界人工智能大会暨人工智能全球治理高级别会议于7月4日在上海盛大开幕,本次大会围绕“以共商促共享 以善治促善智”主题,汇聚全球顶尖科学家、企业家和投资人,共同探讨人工智能领域的前沿技术、产业动向及向善治理。在这场全球人工智能盛宴中,汉王大健康携柯氏音电子血压计重磅亮相,展示医疗科技领域的最新创新成果。
柯氏音电子血压计,顾名思义,采用的原理和市面上大多数电子血压计不同,用的是“柯氏音法”。柯氏音法,也叫听诊法,是国际公认的无创血压测量金标准。其原理是通过监测袖带放气过程中血流冲击血管产生的声音变化直接测得血压,水银血压计便是用的这个原理,可见其准确性。百年来,业界一直尝试将柯氏音法电子化,但由于多方条件限制,均未取得成功。
实现柯氏音法电子化的关键在于“听、控、学、量”四个方面:“听”是不受环境影响,精准识别柯氏音;“控”指柯氏音要求的精准控制均速泄压;“学”指大量优质的血压听诊数据用于训练;“量”是精准、实时的柯氏音测量算法。这样高的技术要求,唯有拥有深厚人工智能技术积淀的高科技企业才能做到。
作为一家老牌人工智能企业,汉王科技自2019年起便投入大量资源,在硬件、数据、算法、软件和设计等方面进行了全链条创新,成功攻克了柯氏音法电子化的百年难题。这一技术突破使得血压计的测量误差平均差控制在≤±1mmHg,远高于国际临床标准对血压计测量误差的要求,有助于对高血压进行精准预测和早期诊断,从而提高高血压的知晓率。
高血压作为一种慢性病,需要长期监测与管理。而面对我国高血压患病人群数量达2.45亿之庞大,医生数量和人均诊疗时间就显得微乎其微。然而,随着人工智能技术的不断革新发展,高血压长期监测与管理问题可以得到有效解决。
汉王大健康在柯氏音电子血压计的配套App中引入了汉王天地大模型,基于它全面强大的多模态协同能力,融合专用的医养知识和专业医疗数据库,能够根据用户的血压数据,结合专业医疗知识,生成个性化的检查建议。为了确保建议的准确性和可靠性,汉王科技还配备了坐席医生进行内容审核和修正。其生成的所有内容建议和分析结果,都会经过坐席医生的严格专业把关,确保患者能够获得科学、准确的健康指导。
在实际应用中,用户可以通过简单的交互界面与天地大模型进行对话,比如在“血压管理问答”模块中,用户可以询问各种关于血压的问题,包括但不限于降血压食物、降血压运动、为什么会患高血压等。
搭载人工智能技术的汉王柯氏音电子血压计,可以对患者进行精准血压监测和结果反馈,并提供相关治疗指导,有助于提高高血压的治疗率和控制率。
在汉王天地大模型的“检验报告分析”模块中,用户可以直接发送医院的检查结果图片,无论是文字还是图片,大模型都能迅速生成相应的、准确的回答。此外,整个系统还设置了医生端,使得医患之间的信息和意见能够实时共享和交互,真正实现医患共同体,使医生对慢病患者的实时健康监护成为可能。
独创巧思,汉王柯氏音电子血压计内置物联网NB模块,无需连接蓝牙或WiFi,就能实现远程监测。医生可以通过手机App获取到的血压数据来建立高血压人群完备的个人电子健康档案,对患者进行分层、分型和细化管理,动态实时评估治疗效果,实现高血压的闭环管理。
上市仅半年,汉王柯氏音电子血压计便在激烈的市场竞争中脱颖而出,618当日在京东、天猫、抖音三平台500元以上上臂式高端血压计中荣获销量第一,超越国外知名品牌。这不仅是汉王柯氏音电子血压计自身实力的体现,也反映了国货品牌在健康监测领域的崛起和进步。未来,汉王柯氏音电子血压计将继续发挥在人工智能技术上的优势,为广大消费者提供更加精准、可靠、便捷的健康血压监测服务。
猿力科技亮相 自研教育大模型全面产品化落地
近年来大模型成为业内最热议题,本次大会也成为众多厂商展示大模型技术与“人工智能+”创新应用的最佳平台。
除了已经被外界熟知的百度文心、讯飞星火、阿里通义千问等通用大模型悉数亮相外,各行各业也纷纷“秀”出在垂直大模型领域的最新落地成果。今年5月,猿力科技于通过了大模型备案,并且在本次世界人工智能大会将展示其自研大模型与支撑的教育产品“全家桶”,包括飞象星球、猿编程、小猿学练机、海豚AI学等国内教育服务产品,及旗下两款AI教育出海产品CheckMath、LeapMath。
在大会现场,海豚AI学所展示的“苏格拉底启发式AI答疑”与“超时空对话AI名人”引发了围观,因有趣、生动的互动场景引起不少参会人士的兴趣。“苏格拉底启发式AI答疑” 是猿力科技旗下首个大模型落地产品,主要面向小学数学解析的场景,通过多轮问答形式引导孩子主动思考、自主解题。“超时空对话AI名人”则通过生成式AI技术,让当今学生可以与爱因斯坦、高斯、鲁迅、莎士比亚等世界顶级智慧大脑随时对话。海豚AI学由国内领先的AI技术团队、教研团队与动画电影团队共同打造,目前为1-9年级学生提供数学、物理、英语三科的自主学习内容和智能规划。海豚AI学开创性地以高质量可交互的动画视频为知识载体,独创了一套让孩子愿意“主动学”的学习流程,通过AI大模型,实现一人一套个性化学习方案,目前海外版本Leap Math覆盖70余国家和地区。
除了海豚AI学,本次大会学习机产品也备受关注。大会上,小猿学练机展出了与大语文场景深度融合的“AI伴读大模型”与“AI百科大模型”,其中“AI伴读大模型”在阅读内容上可以与学习者展开深度互动,学习者可以在口头表达过程中与AI互动共创作品,实现主动阅读、主动思考,进而提升深度表达、理解和写作能力。
作为科技教育公司大模型技术落地的主要场景之一,学习机有着巨大发展空间。随着技术的不断发展,智能学习机产品技术日益成熟,广泛应用于多个教育学习场景,其广阔的应用前景将推动中国智能学习机行业规模快速增长。2023年中国教育智能硬件市场规模达807亿元,同比增长29.53%。艾媒咨询预测,预计2025年中国教育智能硬件市场规模将超1000亿元。
在大模型加持下的学习机更受到消费者关注。调查显示,近七成的中国消费者比较看重智能学习机的AI功能,超五成的受访者比较看重智能学习机学习资源。关于智能学习机行业前景,超八成的受访者表示看好。艾媒咨询分析师认为,未来智能学习机的需求较为广阔,有望渗透到更多的学习场景中;依靠大模型等AI能力及优质课程内容资源和丰富练习资源的智能学习机将成为消费者选购的重要关注点。
据前瞻产业研究院2021年的研究,2020 年 K12 在线教育家庭花费 1万-2万元的意愿人群占据 46%。在“双减”后,学习机承接部分在线教育需求,学习平板出货量同比提升18%。
洛图科技《中国学习平板线上零售市场月度分析报告》数据显示,2023年11月至2024年1月,小猿学练机在全国线上京东、天猫、抖音三大电商合计市场中的单品销量和销售额均排名第一。
分析师认为,人工智能等新兴技术与教育的深度融合,是今后智能学习机领域高质量发展的重要一步,随着AI赋能学习机,高品质、个性化、大规模的三个教育“无法”共存的指标将有希望同步实现。中国教育智能产品正在为传统的教育方式带来更多的可能性和创新性,让不可能逐渐变成可能。
当前,智能教育随着技术的推进成为了风口。数据显示,2020年中国人工智能核心产业规模就已达1500亿元,预计在2025年将达到4000亿元,未来有望发展为全球最大的人工智能市场。分析师预计,AI技术革新将极大改善和提升智能学习机的功能及使用体验,打造出更符合消费者需求的产品。
在大模型落地上,本次大会所展出的“飞象AI写作伙伴”利用大模型的自然语言生成能力,为学生提供作文辅导,通过多轮启发式的对话,帮助学生理解题目、发散思维,引导其逐步列出提纲并成文。从落地情况看,该功能目前已随“飞象智能作业”产品在北京朝阳、平谷全区的100多所学校落地。此外,“飞象课堂”还利用语音、视觉交互技术,开发了面向3-6年级学生的“探秘人工智能”系列课程,学生可以在课堂大屏中与AI互动,帮助学生了解什么是大模型、怎么用好大模型等前沿技术。
聚焦未来科技与人工智能教育领域,猿力科技旗下猿编程研发了智能编程学习助手——猿编程AI-Agent。作为行业首创的内嵌在少儿编程App内的多模态大模型,猿编程AI-Agent已进入测试阶段,可通过智能聊天互动、代码编写实时监测、网络安全教育引导等功能,助力学生高效掌握编程知识、提升思维及实践能力。
此外,猿力科技还携旗下两款AI教育出海产品CheckMath、LeapMath亮相本次世界人工智能大会。凭借在多语言智能批改、“AI大模型+高质量交互动画”等领域的创新,该等产品已经覆盖新加坡等100余个国家和地区,并在多个国家应用榜上长期占据榜首。
从覆盖场景看,目前猿力科技大模型技术已覆盖对话辅导、口语陪练、阅读理解等面向家庭教育端的应用场景,以及作业批改、学情分析、答疑辅导等服务于政府和学校端的教育应用场景。
技术的领先来自于投入。猿力科技在过去12年在科技研发投入近百亿,自研知识图谱、语音识别、自然语言处理等9项关键技术。整体市场正面临激烈的竞争。数据显示,2013-2022年中国教育企业数整体呈上升水平;2022年中国教育企业数达5326家,同比增长1.64%。
猿力科技表示,世界人工智能大会是中国教育科技企业向全球展示“中国智慧”的重要窗口,其希望以大模型技术杠杆撬动全球教育革新,促进全球数字教育创新、包容发展。当前,教育对外开放在国家战略和教育发展战略中具有重要地位,是建设教育强国的重要条件,在此方面,教育数字化转型即是国际教育变革的重点和趋势,也是快速提升世界影响力的主要途径。
中国日报上海分社 记者王颖