14.9万元,满血流畅运行DeepSeek一体机抱回家!清华90后初创出品

558次阅读
没有评论

14.9万元,满血流畅运行DeepSeek一体机抱回家!清华90后初创出品

接近22 tokens/s

金磊 发自 凹非寺

量子位 | 公众号 QbitAI

满血DeepSeek一体机,价格竟然被打到10万元级别了!

而且还不是量化版本,正是那个671B参数、最高质量的FP8原版。

14.9万元,满血流畅运行DeepSeek一体机抱回家!清华90后初创出品

或许有小伙伴要问了,那跑DeepSeek-R1/V3的速度,能跟官方一较高下吗?

可以的,甚至是更快的那种。例如我们提个问题,来感受一下这个feel:

一个汉字具有左右结构,左边是木,右边是乞。这个字是什么?只需回答这个字即可。

14.9万元,满血流畅运行DeepSeek一体机抱回家!清华90后初创出品

△左:一体机;右:DeepSeek官网

视频地址:
https://mp.weixin.qq.com/s/luK0nlylq5faBytZ6Pvc1Q

从视频中不难看出,不仅答案精准,一体机的速度也是肉眼可见地比DeepSeek官网快上一些,粗略估计是已经接近了22 tokens/s

那么这个一体机到底是什么来头?

不卖关子,它就是由北京行云集成电路最新推出的产品——褐蚁HY90,具体价格定到了14.9万元

而且除了产品,这家公司本身也是有不少的“标签”在身上的,其中最为吸睛或许当属CEO了:

季宇,清华90后博士、前华为“天才少年”、计算机学会CCF优博奖获得者。

14.9万元,满血流畅运行DeepSeek一体机抱回家!清华90后初创出品

那么褐蚁HY90具体执行起更多任务时,又会是什么样的效果?

来,更多维度的一波实测走起。

实测10万元级的DeepSeek一体机

我们先在褐蚁HY90部署DeepSeek-R1,来测试一下它的推理能力。

有请AIME 2025的数学题

Find the sum of all integer bases b>9 for which 17b is a divisor of 97b.

14.9万元,满血流畅运行DeepSeek一体机抱回家!清华90后初创出品

视频地址:
https://mp.weixin.qq.com/s/luK0nlylq5faBytZ6Pvc1Q

从内容生成的速度上来看,褐蚁HY90面对数学推理问题,依旧是可以保持接近20+ tokens/s。

并且最终给到的答案也是精准无误:70。

14.9万元,满血流畅运行DeepSeek一体机抱回家!清华90后初创出品

再来一道新版类似“9.9和9.11哪个大”、“Strawberry里面有几个‘r’”,极度迷惑一众AI的难题:

让7米长的甘蔗通过2米高1米宽的门。

14.9万元,满血流畅运行DeepSeek一体机抱回家!清华90后初创出品

△左:一体机;右:DeepSeek官网

速度依旧在线,并且这个问题已经是难不倒DeepSeek,给出的答案也是正解。

而除了DeepSeek之外,我们还在褐蚁HY90上体验了一把类似Deep Research的功能:

14.9万元,满血流畅运行DeepSeek一体机抱回家!清华90后初创出品

视频地址:
https://mp.weixin.qq.com/s/luK0nlylq5faBytZ6Pvc1Q

由此可见,无论是什么类型的题目,褐蚁HY90都能以相对较快的速度丝滑处理。

不过有一说一,以往的一体机,即便是搭载Q4量化版本,成本动辄就要达到200万元。

而褐蚁HY90在搭载满血、未量化的DeepSeek情况下,不仅能够保证速度,更是把价格打掉了一个数量级。

因此,接下来的一个问题便是:

如何炼成的?

在我们聊“如何实现”之前,且需了解一下“什么在阻碍”

首先,大家提到一体机,第一反应大概率就是GPU,而它本身就或许构成了短板。

因为传统GPU方案因显存容量限制,例如671GB需求需多张A100显卡,成本已经超过了百万的级别。

而CPU方案则受限于内存带宽,因为大模型推理需要频繁加载参数(如671B参数的FP8精度模型占用约671GB内存)。

如果内存带宽不足,就会导致计算单元(CPU 核心)长时间等待数据,形成“内存墙”(Memory Wall),严重影响推理速度。

针对上述的短板,行云的褐蚁一体机采用双路AMD 9005系列CPU,通过1TB/s的高内存带宽满足基础推理需求,同时搭配一张中高端消费级GPU作为算力补充。

这种异构计算架构通过软件协同优化,既解决了纯CPU方案在部分推理阶段的算力不足问题,又显著降低了成本,将硬件投入压缩至10万元以内。

14.9万元,满血流畅运行DeepSeek一体机抱回家!清华90后初创出品

除此之外,行云自主研发的推理引擎框架通过算法优化和任务调度,同样对token生成速率起到了显著的提升作用。

在FP8精度下,Decode阶段速度稳定在20TPS以上,且受上下文长度影响较小(128K上下文仍保持15TPS);Prefill阶段在16K上下文内首字延迟控制在80秒以内。

14.9万元,满血流畅运行DeepSeek一体机抱回家!清华90后初创出品
14.9万元,满血流畅运行DeepSeek一体机抱回家!清华90后初创出品

这种高效推理能力尤其适合需要连续生成大量token的场景(如AI Agent),大幅缩短任务响应时间。

不仅如此,团队还针对大模型运行需求,精准平衡了计算能力与内存带宽,支持满血FP8精度的R1/V3模型,并预留扩展能力,未来可支持1.5T参数量的模型。

通过参数压缩技术(如INT4量化),进一步将Decode速度提升至28TPS(1K上下文),满足不同场景对速度与精度的灵活需求。

据了解,团队后续还将对MoE类的模型提供较好的支持。

14.9万元,满血流畅运行DeepSeek一体机抱回家!清华90后初创出品

褐蚁一体机的出现,可以说是改写了行业的格局——

此前运行满血671B模型需百万级设备,而同类低配方案(如32B/70B模型)仍需20-40万元。

行云通过技术整合,将最高质量的模型体验直接带入10万元价位,为中小团队提供了低门槛、高扩展性的AI部署方案。

这一技术突破不仅实现了“高性能+低成本”的平衡,更推动了大模型在智能客服、数据分析等场景的普惠应用。

清华90后创办的公司

最后,正如我们刚才提到的,行云除了产品本身之外,创始团队同样也有不少的亮点。

首先就是创始人兼CEO季宇,他本科就读于清华大学物理系,后转向计算机体系结构方向,获得清华大学计算机体系结构博士学位。

在学术研究方面,他曾作为共同第一作者在顶级期刊《自然》(Nature)上发表计算机体系结构相关论文,并荣获中国计算机学会(CCF)优秀博士学位论文奖(CCF优博奖)。

14.9万元,满血流畅运行DeepSeek一体机抱回家!清华90后初创出品

△行云集成电路创始人兼CEO,季宇

在2023年8月成立行云集成电路之前,季宇曾在华为海思昇腾芯片团队,担任昇腾AI芯片编译器专家,负责多个昇腾编译器项目,也曾入选“华为天才少年”

在华为期间,正因长期专注于AI编译器优化和处理器微架构等挑战性问题,也让他积累了丰富的AI芯片研发经验。

除了季宇本人之外,CTO余洪敏拥有深厚的学术背景和丰富的行业经验。

他本科毕业于华中科技大学,后在中国科学院半导体研究所获得博士学位。

在职业履历方面,余洪敏曾担任百度昆仑芯、华为海思车载昇腾芯片等多款芯片的负责人,并曾在地平线担任芯片研发总监。

他长期领导和管理超过100人的研发团队,精通芯片研发设计全流程,具备丰富的实战经验——成功主导10余款芯片的流片与量产,并多次推动先进工艺数据中心芯片的架构设计、工程实现及大规模商用部署。

值得一提的是,在去年11月份,行云集成电路还得到了一众明星资本的投资,包括智谱AI、峰瑞资本、嘉御资本、春华资本、中科创星、同创伟业奇绩创坛、水木清华校友基金等。

由此,从行云集成电路成立至今的发展来看,是有产品,有团队,更有市场的那种了。

但更重要的一点是,这家刚成立两年的公司,一举实现了一体机圈子里类似的DeepSeek的“高性能+低成本”——

嗯,“中国初创”的含金量还在持续上升。

一体机近期可从官方公众号预约体验,更多详情见↓

14.9万元,满血流畅运行DeepSeek一体机抱回家!清华90后初创出品

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 4 月
 123456
78910111213
14151617181920
21222324252627
282930  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话 Jay 2025-12-22 13:46:04 来源:量子位 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山 衡宇 2025-12-21 10:...
清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026 Jay 2025...
奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板?

Failed to fetch content Read More 
LeCun离职前的吐槽太猛了

LeCun离职前的吐槽太猛了

LeCun离职前的吐槽太猛了 一水 2025-12-21 19:13:08 来源:量子位 “LLM到不了AGI...
自变量王潜:具身智能是物理世界的独立基础模型|MEET2026

自变量王潜:具身智能是物理世界的独立基础模型|MEET2026

自变量王潜:具身智能是物理世界的独立基础模型|MEET2026 一水 2025-12-21 19:11:12 ...