行业新闻

两个月股价暴涨超两倍海天瑞声配得上AI基础数据服务行业老二吗?tvt体育平台app下载

发布日期:2023-02-24  来源:

  海内外多家科技公司加码人工智能,角逐聊天机器人赛道,ChatGPT概念股活跃的背后,AI训练数据服务商海天瑞声(688787.SH)进入大众视野。

  乘上ChatGPT概念快车,海天瑞声两个月股价暴涨超两倍,被下发监管工作函,1月20日至2月21日,海天瑞声累计共有4个交易日涨停。ChatGPT概念股并未一直保持冲高态势,近日开始逐步回调。与此同时tvt体育平台app下载,海天瑞声利空来袭,频遭股东减持。

  就海天瑞声股价波动及具体业务布局,澎湃新闻记者近日曾多次以投资者身份致电海天瑞声,相关负责人表示,公司没有需要披露而未披露的重大事件。“和ChatGPT相关的自然语音处理,以往在我们公司总体业务中占到10%左右,具体占比要等2022年年报披露。它(ChatGPT)并没有给公司带来大量的订单增加,我们的客户还是比较稳定的,也有一些新客户,但不是这个领域的。”

  截至2月22日,海天瑞声涨1.54%,报201.07元/股,总市值86亿元。

  从2月1日起,海天瑞声共发布4次股票交易严重或异常波动的公告,海天瑞声的实际控制人贺琳四次回函,称其本人不存在处于筹划阶段的涉及公司的重大事项,在股票交易异常波动期间,其也不存在买卖海天瑞声股票的情形。

  贺琳是谁?时间回溯到2005年,当时北京海天瑞声科技有限公司成立,注册资本为30万元,贺琳以货币出资了27万元,现在的海天瑞声就是由北京海天瑞声科技有限公司变更设立。

  在北京海天瑞声科技有限公司设立初期,该公司从事的语音采集、标注业务,业务量还比较小,主要从事语音采集及利用业内公知tvt体育平台app下载、基础的开源算法技术对采集的语音进行加工处理。随着人工智能行业迅猛发展,行业对训练数据开始产生较大的市场需求,2008年末,北京海天瑞声科技有限公司核心技术人员郝玉峰、李科、唐涤飞先后加入,开始带领研发业务人员逐步进行训练数据生产的平台工具、基础研究、生产技术等方面的技术研发。

  当时的贺琳未参与具体技术研发,其主要负责战略、融资、外部关系等,而基于贺琳的人脉基础,该公司开始为微软等企业提供语音训练数据服务,并在2009年至2012年期间与阿里、百度、腾讯、三星等大型科技公司建立了稳定的合作关系。

  海天瑞声的招股书披露,贺琳出生于1968年,毕业于北京大学,1987年至2017年7月任职于中国科学院声学研究所,从事语音识别、语音合成、汉语语言理解、语音心理测试等方面的研究工作,先后参与了“汉语人-机语音对话系统工程”“汉语语音参数合成”等国家自然科学基金重点项目、国家八六三计划智能计算机主题项目和中国科学院“八五”重大项目,完成《计算机汉语口语输出系统的设计与实现》等论文十余篇行业新闻,参与编写《汉语语音合成-原理和技术》著作。

  因为在中国科学院声学研究所的就职经历,当海天瑞声2019年意在科创板上市时,曾有人质疑贺琳违反了中科院兼职规定,于在职期间创立北京海天瑞声科技有限公司。海天瑞声也被监管问询,贺琳在任职中科院声学研究所期间创办海天瑞声是否合规,以及由贺琳作为主要创作人的具体专利发明或著作权是否属于中科院职务发明是否存在权属纠纷等。

  经过一番波折,海天瑞声最终在2021年8月13日正式登陆上交所科创板,发行价格为36.94元/股。按照招股书所示,海天瑞声的前10大股东中有2名自然人股东,一个是贺琳,另一个是唐涤飞。

  上市一个月后,贺琳与丈夫蔡惠智在2021年9月签订《离婚协议书》并进行了相关财产分割。蔡惠智是中科海讯(300810.SZ)董事长,也曾在中国科学院声学研究所任职。中科海讯是立足于海洋工程和水声工程领域的高科技上市企业,专注于高性能信号处理平台、声纳系统、仿真系统和大数据应用等产品的研制开发。根据离婚协议,蔡惠智将其持有的中科海讯1170万股股票赠与他与贺琳的女儿蔡佳耘。

  上市两个月后,也就是2021年10月,海天瑞声公布了唐涤飞的离职,公告称其因个人原因不再担任公司任何职务。唐涤飞自2022年9月开始减持海天瑞声。截至2023年2月20日,唐涤飞及一致行动人中瑞立(员工持股平台)已通过集中竞价和大宗交易方式减持公司股份约128万股,占公司股份总数的3%。其中,拟通过集中竞价方式减持部分已减持完毕,减持总金额为7868.6万元。

  根据海天瑞声2022年第三季度财报,贺琳、北京中瑞安投资中心(有限合伙)、中移投资控股有限责任公司、唐涤飞和北京清德投资中心(有限合伙)是海天瑞声前五大股东。前文中提到的中瑞立、中国互联网投资基金管理有限公司-中国互联网投资基金 (有限合伙)(简称:中网投)是其前10大股东。

  海天瑞声招股书披露,2019年12月,中网投与海天瑞声、贺琳签署《投资协议》,约定中网投以7998万元的价格认购公司发行的129万股新增股份,每股认购价格为62元,对应新增注册资本129万元。

  据悉,中网投是数字经济股权投资领域的国家队。2017年,中国互联网投资基金经国务院批准成立,由中央网信办和财政部共同发起。该基金规划总规模1000亿元人民币。

  tvt体育平台app下载

  中国移动的全资子公司中移投资也是海天瑞声的首发前股东之一,共持有海天瑞声股份385.5万股,占公司总股本的9.01%。当时海天瑞声净资产(股东全部权益)评估值为18.67亿元。截至20日中移投资拟减持公告发出,海天瑞声总市值达94亿元,约为入股时估值的5倍。

  此次中移投资计划通过集中竞价及大宗交易方式减持所持有公司股份合计不超过128.4万股,合计不超过公司股份总数的3%。若以海天瑞声20日的收盘价218.90元/股计算,中移投资合计减持的金额不超过2.81亿元。

  央企与“国家队”基金入场,给海天瑞声带来了什么?在2021年12月的一份投资者关系活动记录表中,海天瑞声披露,公司2019年底通过战略融资引入中国移动和中国互联网投资基金,过往两年中已经通过战略协同安排,逐渐进入电信行业和网信安全行业,并借此代表行业与国家政策制定部门实现有效对接。未来,公司将继续与两方保持紧密战略协同,助力公司业务不断向电信、网安等政企领域拓展。

  值得关注的是,除中移投资、唐涤飞及一致行动人中瑞立在减持海天瑞声外,北京清德投资中心(有限合伙)在2022年10月26日至2023年2月15日期间,通过集中竞价及大宗交易方式减持其持有的海天瑞声股份40.5463万股,占该公司股份总数的0.95%。

  2023年2月2日至2023年2月21日,上海丰琬通过集中竞价方式减持海天瑞声42.8万股,占公司股份总数的1.00%,减持总金额6364.9万元。

  tvt体育平台app下载

  海天瑞声方面人士告诉澎湃新闻记者,海天瑞声如今已是数据服务行业的头部企业,现有员工两百多人,岗位多聚焦于技术方面,数据标注等工作则外包给供应商来做。“毛利高的业务是数据库,开发一次,后面可以重复授权使用。”

  海天瑞声也曾披露,就目前训练数据产品的销售情况看,平均生命周期大概在5年左右,有部分产品生命周期可达8-10年之久。一般来讲,数据集产品在生产出来后,为了保证数据集自身的平衡程度,通常不会做大规模的更新、拓展,而是在标注类型方面做一些完善或者进行小规模的扩建调整。如果判断有新的市场趋势,公司会研发新的数据集去覆盖。

  从大行业来看,目前市场上数据服务市场主要由品牌数据服务商、企业自建团队以及一些中小数据服务商构成。海天瑞声的竞争对手仍是传统模式下的数据服务公司,国内的主要竞争对手是一些品牌数据提供商,如慧听、标贝以及一些新兴公司,国外的主要竞争对手则是澳大利亚公司Appen。

  根据海天瑞声2022年半年报,目前在国内AI基础数据服务行业中,海天瑞声排名第二,市场占有率达12.9%。截至去年6月30日,海天瑞声的客户超700家,除阿里、百度、微软、字节跳动等大型科技公司外,科大讯飞tvt体育平台app下载、商汤科技、云知声、海康威视等人工智能企业,以及中国科学院、清华大学、中国科学技术大学等科研机构均是其客户。

  虽然海天瑞声的客户众多,但受疫情影响,该公司近几年的业绩并不尽如人意。Wind数据显示,2019年至2021年,海天瑞声的营业收入逐年下降,分别为2.38亿元、2.33亿元和2.06亿元;这三年该公司的净利润也经历下滑,分别为8158.68万元、8208.1万元和3160.54万元。

  此外,根据海天瑞声的预期,该公司2022年的净利润还将下滑。此前1月,海天瑞声发布的2022年业绩预告显示,期内营业收入为2.6亿元至2.65亿元,同比增加25.92%至28.34%,归母净利润为2800万元至3000万元,同比下降5.08%至11.41%。

  若从海天瑞声的具体业务来看,其研发、生产的训练数据覆盖智能语音、计算机视觉及自然语言处理三大AI核心领域。其中,自然语言处理(Natural Language Processing,NLP)与近日火爆的ChatGPT相关,海天瑞声的证代也向澎湃新闻记者表达了该观点。

  不过,自然语言处理业务并非海天瑞声的营收支柱。以2021年的业绩为例,期内该公司自然语言处理业务营收2514.9万元,仅占总营收的约12%。

  当ChatGPT概念火爆出圈,海天瑞声曾发布公告撇清与ChatGPT的关系,称公司未与OpenAI开展合作,其ChatGPT的产品和服务未给公司带来业务收入。海天瑞声还强调公司专注于为包括AI技术公司在内的AI产业链各类机构提供算法模型开发训练所需的专业数据集,业务与从事人工智能算法及应用开发的企业有比较大的区别。

  中国的大型科技企业、人工智能领域企业纷纷表示入局ChatGPT,是否会为海天瑞声带来订单的增长?海天瑞声方面人士回应澎湃新闻称,“公司负责做数据,(研发聊天机器人的公司)是我们的下游客户利用公司的数据训练产品,我们不是直接去生产产品。”

  该人士表示,“技术是一个逐渐升级的过程。现在聊天机器人的概念刚刚起步,技术公司想要应用落地,也需要在内部进行技术上的改革或创新,后期才会看到(订单)的大量增长。不管是他们那端还是我们这端,初期都不会有立竿见影的效果,或出现订单爆发式增长的情况。”

  另值得关注的是,一些有实力的科技公司在自建团队做数据业务,这是否会对海天瑞声造成影响。对此,海天瑞声方面人士也向澎湃新闻记者表示:“从体量上来说,首先要达到规模效应,客户才可能考虑自建团队,自建团队一般是解决自身部分数据需求,比如敏感数据。出于成本及规模化效益考虑,客户仍会大量购买数据服务提供商的数据及服务。”

  安信证券指出,ChatGPT的训练过程代表着在未来的人工智能领域,优质的数据源将成为行业的基础设施。海天瑞声表示,公司数据处理业务正在快速增长,为保障充足产能,公司已开始在技术研发、资源体系扩充两个维度同步进行建设。

  根据该公司2021年财报,海天瑞声拥有2个“面向NLP特定领域事件理解、抽取与标注平台”的在研项目,预计总投资规模为180万元和160万元,最新进展为完成、上线了面向NLP特定领域事件理解、抽取与标注平台,并已支持多类业务场景。

  对于公司未来的增长点,从现有信息看,海天瑞声并未过多着墨ChatGPT,而是将境外业务和智能驾驶作为其核心增长点。

  据澎湃新闻记者了解,近几年,海天瑞声一直在持续布局海外市场。2022年上半年,该公司境外收入占比达57.14%,境外市场签单额同比增长近2.5倍。2022年前三季度境外基础训练数据业务收入同比增长近140%。境外收入的主要驱动因素来自多语种相关的智能语音以及计算机视觉类业务。

  浙商证券也在研报中表示,随着海外业务的加速布局,海天瑞声能够更好地发挥其在语音和自然语言领域的多语种优势。

  智能驾驶业务方面,海天瑞声表示,从目前公司摸排到的市场需求情况来看,单家智能驾驶客户(主机厂或头部智能驾驶算法公司)每年的数据预算从百万至上亿元不等,数据需求整体呈现加速上升的趋势。

  若将视野放大,整个AI训练数据市场究竟有多大?根据Cognilytica数据统计显示,2021年全球AI训练数据市场需求约为42亿美元,并预计到2027年这一需求将增长到220亿美元,2021年至2027年复合增长率达32%。

  聚焦到中国市场,根据IDC发布的《2021年中国人工智能基础数据服务市场研究报告》,预计中国AI基础数据服务市场近5年复合年增长率将达到47%,预期2025年将突破120亿元。

相关新闻