小荷平台-算法及大模型备案公示说明


为依法保障用户对小荷平台算法服务的基本原理、目的意图和主要运行机制等的知情权,告知用户小荷平台提供的算法服务备案情况,小荷平台服务提供者(或简称“我们”)制定本《算法及大模型备案公示说明》,帮助用户了解在使用小荷平台产品和服务的过程中我们如何通过利用算法技术向用户提供信息和服务。
本说明内容共同适用小荷健康小程序、小荷医生App的最新版本,如有单独适用的目的将在下列列表说明。由于产品迭代升级,部分历史版本可能与当前版本情况存在差异,以实际情况为准。


一、算法公示

(1)豆包大模型算法

算法名称:豆包大模型算法(曾用名:云雀大模型算法)。

算法基本原理:豆包大模型算法是一种基于 Transformer 架构的语言模型,通过前文预测下一个最可能的词语来实现文本生成。其中运用的新技术主要是基于 Transformer 架构的语言模型和基于人类反馈的强化学习,前者建模了大量蕴含在自然语言中的知识,后者使得模型可以通过对话方式提供合适的内容。

算法运行机制:豆包大模型算法在用户提出问题后,识别用户的需求,通过预先学习与全网搜索内容,在对话框中或落地页中展示对应的结果。该模型首先通过大规模无监督的预训练学习语言的统计规律和知识,然后进行有监督的微调让模型学会遵循用户的指令,最后通过强化学习训练让模型生成合适的内容。

算法应用场景:豆包大模型算法主要应用于今日头条、抖音、剪映、番茄小说、西瓜视频、飞书、豆包、悟空浏览器、懂车帝等网站或应用程序。

算法目的意图:豆包大模型算法旨在提升用户获取信息效率,扩展知识边界,通过提供优质问答交互等服务,帮助用户深入了解世界。

备案编号:网信算备110108823483901230031号

(2)小荷医疗大模型算法

算法名称:小荷医疗大模型算法。

算法基本原理:小荷医疗大模型算法是一种基于 Transformer 架构的语言模型,通过前文预测下一个最可能的词语来实现文本生成,通过海量公开的高质量医疗健康文本进行预训练,增加高质量人工标注数据、优化强化学习算法。其中运用的新技术主要是基于 Transformer 架构的语言模型和基于人类反馈的强化学习,前者建模了大量蕴含在自然语言中的知识和专业知识,后者使得模型可以通过对话方式提供合适的内容。

算法运行机制:小荷医疗大模型算法在用户提出问题后,识别用户的需求,通过预先学习与全网搜索内容,在对话框中或落地页中展示对应的结果。 该模型首先通过大规模无监督的预训练学习语言的统计规律和知识,然后进行有监督的微调让模型学会遵循用户的指令,最后通过强化学习训练让模型生成合适的内容。

算法应用场景:应用于文本及智能对话生成场景,服务于个人用户端,根据用户输入的性别、年龄、症状描述等医疗健康文本信息,生成健康科普知识、健康咨询指导等文本信息。

算法目的意图:小荷医疗大模型算法旨在为用户提供健康科普知识问答、AI健康咨询及医生数字分身产品等服务,帮助用户获得医疗健康知识。

算法备案编号:网信算备110108823483901240107号

二、大模型公示

模型名称:豆包大模型(曾用名:云雀大模型)

模型备案编号Beijing-YunQue-20230821

模型应用场景:豆包大模型主要应用于抖音网站或应用程序内的AI搜索等相关场景,以及抖音内接入的豆包服务。