作为国内领先的AI训练数据龙头,8月3日海天瑞声(688787.SH)定增申请终于获得上交所受理。在募资申报稿中,公司表示,此次募资是为“业务扩张、寻求新的业绩增长点。”
此次定增,海天瑞声表示将用于投资“AI大模型训练数据集建设项目”以及“数据生产垂直大模型研发项目”,两者的投入金额分别为3.83亿元和4.07亿元。前者预计建成第二年开始盈利,总计八年盈利2.43亿元,后者则不产生直接收益。但对于项目建成的具体时间,公司并未标明。
在募资以外,公司也牺牲了净利润用于研发。数据显示,公司研发费用的占比一直在扩大。2021年-2022年,海天瑞声研发费用占营业收入比例从29.31%上升至35.86%,公司净利润同比下滑61.49%和6.81%。
AI项目8年盈利预计2.43亿
公开资料显示,海天瑞声是国内领先的AI训练数据龙头。在ChatGPT概念股活跃的背后,AI训练数据服务商海天瑞声进入大众视野。公开资料显示,公司产品服务在人机交互、智能家居、智慧城市等领域均有深度应用,对标海外龙头ScaleAI和Appen。
在AI光环的笼罩下,海天瑞声今年以来股价表现相当强势。从1月13日开始,海天瑞声股价飙升,从45.7元/股一路涨至192.26元/股(3月31日),此后开始逐渐回落。截止8月4日,公司收报股价83.38元,市值上涨了82%。
海天瑞声表示,本次募投项目中,总投资额7.9亿元,资本性支出5.55亿元、非资本性支出2.35亿元。
其中,AI大模型训练数据集建设项目主要涉及与产品开发相关的产品研发类投入,数据生产垂直大模型研发项目为基础研发类项目,建设目标为通过大模型基础研究,研发海天瑞声数据生产垂直大模型,并以此为核心,升级海天瑞声一体化技术支撑平台。
公告称,本项目的数据集产品具体可分为三大类:通用及特定垂直领域的大语言模型训练数据、多模态大模型训练数据集和大模型评测数据集。
对于AI大模型训练数据集建设项目,海天瑞声进行了效益测算,预计建设期3年、运营期8年,公司将从运营期第二年开始盈利,预计税后盈利757.41万元,在运营期第四年达到盈利高峰,为4920.66万元,8年总计盈利2.43亿元。值得注意的是,公司对募投项目的建设时间和运营时间给预期的时间。
AI大模型训练数据集建设项目效益测算
对于募资的第二个项目——数据生产垂直大模型研发,海天瑞声表示,本项目建设目标为升级海天瑞声一体化技术支撑平台。公司表示,项目建成后将成为公司主营业务长期发展的技术底座,不直接产生效益。
随着以ChatGPT为代表的大模型技术的崛起,人工智能产业迎来了新一轮重大发展机遇。
全球根据艾瑞咨询数据,2022年中国人工智能产业规模达1948亿元,预计2027年市场规模将达到6122亿元,年复合增长率为25.6%,主要与智算中心建设以及大模型训练等需求拉动的AI芯片市场、无接触服务需求拉动的智能机器人及对话式AI市场等快速增长相关。
不过公司也预警,受宏观经济增速放缓、2023年市场竞争较为激烈以及数据出境相关法规落地实施所带来的影响,公司部分业务进或将放缓。如果公司收入增长无法覆盖持续加大的人工投入及期间费用支出,公司业绩存在下滑或亏损的风险。
净利润连续两年下滑,研发投入近四成
海天瑞声在募资以外,也将大量的资金用于研发。数据显示,公司研发费用的占比一直在扩大。钛媒体App查阅财报看到,2021年-2022年,海天瑞声研发费用6052.09万元和9427.34万元,同比上升39.14%和55.77%,占营业收入从29.31%上升至35.86%。
公司解释,研发费用主要用于基础研发、产品研发领域的继续投入,以及加速提升智能驾驶行业数据服务业务能力以及整体数据生产的智能化水平,同时持续推动数据集产品的扩充建设计划,加大智能语音、计算机视觉领域、自然语言训练数据集产品储备。
但这样的投入也牺牲了净利润的稳定性。钛媒体App查阅公司财报了解到,海天瑞声净利润忽上忽下,且一直处于下滑趋势。
数据显示,海天瑞声2022年净利润2800万元,同比下滑16.54%。对比一下,2019和2020年净利润分别为8158.68万元和8208.1万元,2021年和去年的净利润只有2881.74和2064.77万元。
进入2023年,海天瑞声迎来了首亏。
数据显示,2023年第一季度实现营收2882万元,同比下降39.81%;归母净利润亏损1362万元,同比下降244.27%;扣非净利润亏损1705万元。
对于公司业绩变动的原因,海天瑞声表示,公司毛利率受毛利水平较高的境外业务、标准化产品收入占比下降影响,同比降幅明显。此外,公司一季度销售费用及管理费用同比出现较大增长。2023年一季度,公司研发费用1693.31万元。
AIGC的核心三要素是算法、算力和数据。其中数据包括数据采集、训练和推断,这是海天瑞声的主战场。截至目前,海天瑞声合作方包括字节跳动、阿里巴巴、腾讯、百度、科大讯飞、海康威视等。据IDC数据显示,2021年海天瑞声在国内AI基础数据服务行业市占率高达12.9%,位居第一。
自动驾驶训练数据需求方兴未艾,海天瑞声发力布局。
国金证券研报指出,自动驾驶约占国内AI基础数据服务市场规模的35%,系第一大下游场景,2025年市场规模或达25亿元。自动驾驶领域的业务类型可分为车载摄像头采集的2D图像数据标注与激光雷达采集的3D点云数据标注。目前业内客户对于全栈式闭环数据解决方案需求较高。
在2022年年报中海天瑞声表示,公司智能驾驶数据业务取得显著成效的背景下,公司收入较去年同期增长。但同时,公司为加速提升智能驾驶数据服务能力、整体数据生产的智能化水平,以及推进数据集产品扩充建设计划等,持续加大研发投入,造成期间费用大幅增长。4月份,海天瑞声正式推出DOTS-AD自动驾驶标注平台。
(本文首发钛媒体APP,作者|郭梦仪)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App