|
一、快手自研的大语言模型“快意”(KwaiYii)已进入内测阶段并公布在GitHub上。据官方介绍,KwaiYii-13B属于13B规模系列大模型,其中KwaiYii-13B-Base预训练模型在知名模型排行榜上表现出色。对话模型KwaiYii-13B-Chat适用于创作、咨询、数学、代码、对话等任务。经评估,其创作、咨询、数学能力接近GPT-3.5。项目地址:http://github.com/kwai/KwaiYii
点评:快手对大模型技术落地应用的思考较为特别,即充分发挥自身优势。聪明的智能可以依靠站内丰富的内容生态,通过互动对话的形式帮你快速查找视频、达人、百科等内容,这是一种全新的信息获取形态。同时,快手AI对话也为快手搜索打破了站内内容的壁垒,可为用户提供全网内容的检索服务。你的下一个搜索引擎,又何必是搜索引擎?
二、北京市卫健委发布了《北京市互联网诊疗监管实施办法(试行)》,要求医疗机构在互联网诊疗中加强药品管理,禁止使用AI等自动生成处方,且不能在开具处方前提供药品。医疗机构需实名认证互联网诊疗医务人员,确保合法资质。实施实名制,患者需提供真实身份信息,禁止冒名就诊。医疗机构要切实遵循规定,医务人员不得以药品利益为目的推荐、指定购买地点。卫健委将建立监管平台,监管互联网诊疗活动。
点评:目前“互联网+医疗健康”发展迅速,从互联网医院到明确常见病、慢性病患者互联网问诊可进行医保报销,从网售药品到核心诊疗再到互联网医保,各地出台方案积极支持在线医疗全面发展,筑牢了在线医疗用户规模增长基础。由中国互联网络信息中心发布的第51次《中国互联网络发展状况统计报告》显示,截至去年底,我国互联网医疗用户规模已经达到3.63亿,约占网民整体的34%。随之而来的是先药后方、AI开处方、诊疗事故等乱象,为互联网诊疗埋下重大安全隐患。虽然AI时代的发展是大势所趋,但有的事还是不要过分依赖,手动为好。
三、海尔智家与30多家单位共同创立了智慧家庭大模型专委会,包括国家智能家居质量检验检测中心在内。该专委会旨在推进大模型在智慧家庭领域的实际应用,探讨安全、标准、评测等问题,促进技术进步,提升智慧家庭水平,为用户创造更智慧便捷的生活体验。
点评:海尔智家早在七月便联合信通院牵头制定国内首个家居行业大模型标准,该标准主要围绕大模型在智能家居中的应用场景、实现效果、服务成熟度等方面建立指标。海尔智家能够作为智慧家庭大模型专委会的主要发起方,背后离不开行业独有的海尔智家大脑的探索和布局。未来,家居行业大模型的发展仍需各方企业协力共建。此次智慧家庭大模型专委会的成立,将会在智能家电、智慧家庭行业的发展中发挥出至关重要的积极作用,并以技术升级不断为智能家居产业发展注入新的动能与活力。
四、好未来公司宣布数学领域大模型MathGPT正式上线公测,支持中英文的PC和移动端体验。MathGPT以解题和讲题算法为核心,服务全球数学爱好者和科研机构,是国内首个数学垂直领域大模型。MathGPT覆盖小学至高中数学题,包括计算、应用、代数等,支持追问功能。技术报告显示,MathGPT在多个评测中获得最高分数。体验链接:http://www.mathgpt.com/
点评:与传统的泛化、通用大模型不同,数学的本质决定了它的逻辑属性更强,也对大模型的算法提出了和以往不同的要求。MathGPT专攻数学大模型,解题讲题两手抓。今年高考时曾有媒体报道利用国内外主流大模型做高考题,一些在发布会上说得天花乱坠的大模型实际表现却令人不敢恭维,十道数学题全错,作文没题目还跑题。
五、Meta联手CMU打造“通用机器人智能体RoboAgent”,轻松泛化上百种未知任务,用少量数据实现十多种复杂技能,烘培上茶擦桌子样样行。
点评:前段时间,谷歌DeepMind推出了耗时半年多打造的项目RT-2,能做数学推理,也能辨认明星,在网上火了一把,而RoboAgent仅在7500个轨迹上完成了训练。大模型与机器人的结合,既拓展了彼此的应用范围,也开拓了全新的商机。
六、来自CMU和Snap机构的研究人员,合作构建了一个根据文本描述创建电影画面的大模型Text2Cinemagraph,只需短短一行字,就可以让艺术大师的作品动起来。只需要一句话,大模型就能将其生成一个风格一致,画质细腻的动画。体验链接:http://text2cinemagraph.github.io/website/
点评:Text2Cinemagraph的这种技术具有很大的革新性,它将文字和图像结合,将传统的静态描述转化为动态的视觉体验。这不仅提高了艺术创作的效率,也为艺术创作提供了更多的可能性。未来,Text2Cinemagraph可能会推动艺术和技术的结合,为我们的生活带来更多的色彩。
七、来自北京大学、中国科技大学、微软亚洲研究院的研究者合作提出了一种基于开放域扩散的新型视频生成大模型DragNUWA。它从语义、空间和时间三个角度实现了对视频内容的细粒度控制,拖拽下图像就能生成视频。
点评:以拖动(drag)的方式给出运动轨迹,DragNUWA 就能让图像中的物体对象按照该轨迹移动位置,并且可以直接生成连贯的视频,属实惊艳。
八、上海AI实验室推出书生·浦语大模型的升级版InternLM-Chat-7B v1.1,是首个具有代码解释能力的开源对话模型,能够根据需要灵活调用Python解释器等外部工具,在解决复杂数学计算等任务上的能力显著提升。此外,升级版还可通过搜索引擎获取实时信息,提供具有时效性的回答。链接:http://github.com/InternLM/InternLM
点评:代码解释器等外部插件能够有效弥补模型的不足,提升大模型解决实际应用中复杂问题的能力。本次书生·浦语开源升级,使大模型具备了调用代码解释器及搜索引擎等外部插件的能力,为大模型解决复杂任务赋能。面对解方程等复杂的数学计算问题,模型仅凭自身能力难以完全做对,而有了代码解释器的加持,模型只要能写对方程式,就可调动代码解释器完成方程求解。
来源:http://www.yidianzixun.com/article/0qcYjYeo
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|