0次浏览 发布时间:2025-04-07 14:33:00
记者7日从第四范式获悉,公司一体机解决方案SageOne IA日前进行了全新升级,推出“模型弹性伸缩”技术,来应对流量波动。
第四范式是港股代表性AI公司。公司日前联合华为昇腾AI发布全新升级SageOne IA一体机解决方案,在支持DeepSeek V3/R1、QWen2.5、LLama3.3等主流大模型的基础上,企业可灵活在满血版和多个蒸馏模型之间切换。方案中集成了智能算力池化技术(vGPU)、大模型应用开发平台,以及开箱即用的AI应用套件。公司希望,通过构建从底层算力到上层应用的完整自主技术体系,为企业智能化转型提供新一代全栈式基础设施。
当前企业一般采用传统扩缩容方案,即当应用负载增加时,通过人工干预或系统按既定规则扩展计算节点,保证服务可用;当负载减少时释放多余的计算节点,这一定程度上增加了算力成本和IT运维复杂度。“模型弹性伸缩”是系统根据负载状况,自动灵活切换同一系列下不同参数大小的模型提供模型服务,无需额外扩展计算节点,节省算力成本,提升资源使用效率的同时还大大降低运维工作量。
公司相关人士举例说,在大模型推理场景下,负载较小时,满血版模型提供高精度的推理服务;进入高峰时段时,系统会自动将满血版降级为一个或多个蒸馏版/量化版模型实例,来处理大量并发请求。
由此,结合模型预加载等技术,可避免模型服务切换时,导致服务中断或输出质量波动问题,做到用户无感知的平滑切换;当流量回归常态后,系统再自动升级到满血版模型服务,并释放多余的较小参数模型实例。
同时,系统可预设多种基于负载的触发条件,如结合GPU使用率、请求队列长度、响应延迟等资源健康度指标,形成动态切换策略和任务路由机制,使弹性方案在实际应用中更贴近业务需求。
钉钉CEO无招:79%A股企业使用钉钉,数字化底座已成中国经济“新基建” 昨日在钉钉十周年发布会现场,CEO无招没有过多渲染未来概念,而是用一组扎实的数据让业界侧目:全国近八成的A股上市公司正在使用钉钉。这一比例远超市场预期,也意味着钉钉已经不再只是一款办公软件,而是成为中国企业,尤其是龙头企业数字化转型升级的核心基础设施。01 从“办公工具”到“数字底座”钉钉诞生于20 2025-08-26 10:31:00
脑机接口技术新突破!苏州“国字号”院所发布重磅成果 近日,位于苏州高新区的科研院所——中国兵器工业集团第二一四研究所苏州研发中心(简称二一四所苏州研发中心)发布信息,其利用“脑控运动康复训练系统”,促进了一名脑卒中患者的运动功能恢复。该患者是一名16岁男孩,因突发性左侧脑出血,在苏州市立医院接受左脑开颅急救后,右手完全丧失了基本活动能力。二一四所苏州 2025-08-25 11:02:00
剽窃华为芯片技术,尊湃14人获刑被罚1350万 来源:新京报新京报贝壳财经讯(记者韦博雅)8月2日,新京报贝壳财经记者获悉,2025年7月28日,上海市第三中级人民法院对尊湃侵犯华为商业秘密案件做出一审判决,前海思员工共14人被判处有期徒刑(其中5人实刑,首犯被判处有期徒刑6年),总计罚金1350万。其中,被告人张某犯侵犯商业秘密罪,判处有期徒刑 2025-08-11 15:35:00
14岁辍学女生签约MCN,因难忍“变态管理”强行解约,被起诉索赔 7月27日,山东德州的李丽(化名)向媒体求助,14岁的女儿小云与济南一家MCN公司签下“卖身契”,6个月发了1.3万元工资,因不堪忍受公司一些做法强行退出后,被起诉索赔1.7万元“损失”。记者注意到,合同对合作模式、工作要求、合同终止、主播罚款及违约赔偿有详细的条款。比如擅自接第三方活动、擅自提取佣 2025-07-28 15:18:00
和讯投顾万宗昂:下周密集的产业会议和事件 下周密集的产业会议和事件,大概率会成为资金炒作的 “剧本大纲”,但散户想从这些热点里赚钱,关键不是追消息,而是先分清 “真主线” 和 “蹭热点” 的区别。结合过往概念炒作的规律,咱们逐个拆解这些事件的潜在机会与坑点:?7 月 26 日 - 27 日:人工智能与华为系成焦点,警惕 “伪算力” 公司?世 2025-07-27 11:13:00