NVIDIA博客发文:全球前十的AI大模型,全部使用MoE架构

一、MoE:颠覆传统的稀疏激活架构 2025 年的 AI 领域,一个显著共识正在形成:混合专家(Mixture of Experts, MoE)架…
AI人工智能方兴未艾,IT行业商用市场的近况,也许能为我们一展未来消费市场的前沿技术和产品。生成式AI大模型,数据中心、云计算、云存储,看看商用市场和开发者领域每天发生了什么。

一、MoE:颠覆传统的稀疏激活架构 2025 年的 AI 领域,一个显著共识正在形成:混合专家(Mixture of Experts, MoE)架…

一、OpenAI的红色警报源于何方? 2025年12月1日,OpenAI首席执行官山姆·奥特曼(Sam Altman)向全体员工发出内部备忘录…

2025年12月1日,深度求索公司同时发布两款正式版模型:DeepSeek-V3.2 与 DeepSeek-V3.2-Speciale(官方新闻稿)。 一款…

Cloudflare (CF) 早已不再仅仅是一个 CDN(内容分发网络)服务商。对于普通用户、博主、甚至独立开发者来说,Cloudflar…

ESP32作为乐鑫科技(Espressif)于2016年推出的双核Wi-Fi+蓝牙MCU,已成为全球开发者最喜爱的物联网开发平台之一。从…

2025年9月30日,Anthropic正式发布Claude Sonnet 4.5,这款被定义为“全球最强代码模型”“最擅长构建复杂智能体的模型”及…

一、什么是eARC? eARC(Enhanced Audio Return Channel)是HDMI 2.1标准的核心升级功能,全称“增强型音频回传通道”。…

在人工智能、高性能计算(HPC)和数据中心需求爆炸式增长的今天,数据传输效率已成为制约系统性能的关键瓶颈。2025年6…

大概从2010年开始,我把RSS作为主要信息来源,每天习惯性地到RSS列表中看看有没有我感兴趣的信息。但自从上班后,看RSS…

时隔一年,英伟达CEO黄仁勋的"一年之约"即将兑现。据多方消息源透露,英伟达与联发科计划在5月27日开幕的Com…

2025年4月29日,阿里巴巴通义千问团队正式发布新一代大型语言模型Qwen3系列(官方博客文章),包含8个版本(涵盖MoE混…

2025年4月25日,在武汉举办的百度Create开发者大会上,百度创始人李彦宏正式发布文心大模型4.5 Turbo与文心X1 Turbo两…

2025年2月17日,腾讯宣布自家多个App和服务接入DeepSeek R1推理大模型,甚至包括其手机端AI应用“腾讯元宝”,开放规模空…

Ollama也许不是最好用的LLM安装管理工具,但它对于第三方工具的兼容性应该是最好的。不仅有Open-WebUI这一大帮手,各类…

2025年1月20日,杭州深度求索人工智能基础技术研究有限公司正式发布了其最新研发的高性能AI推理模型——DeepSeek R1。该…