全球互联网流量在2026年迎来历史性转折——据网络基础设施与安全公司Cloudflare(Cloudflare, Inc.)于6月初公布的数据,自动机器人(automated bots)产生的HTTP请求量首次超越人类用户,占比达到57.5%,而人类活动仅占42.5%。这一变化比行业此前预测的2027年提前约一年发生,主要驱动力来自基于人工智能(AI)的代理程序(agentic AI)的大规模部署。另据数字安全企业HUMAN Security(HUMAN Security, Inc.)发布的《2026年AI流量状况报告》(State of AI Traffic Report),AI驱动的流量增长速度是人类用户流量的8倍,进一步印证了这一趋势的加速性。

数据解析:HTTP请求量超越背后的统计口径
Cloudflare此次发布的数据来源于其全球边缘网络监测的海量HTTP请求。该公司联合创始人兼CEO马修·普林斯(Matthew Prince)在社交平台表示,业界此前普遍认为机器人流量超过人类要等到2027年,当前进展显著快于预期。需要指出的是,该统计以HTTP请求(即客户端向服务器发出的数据请求)次数为口径,而非用户在线时长或实际消耗的带宽。因此,在视频流、社交媒体深度互动、文件下载等高带宽活动中,人类用户依然占据主导地位,但就服务器交互触发的频率而言,机器已经占据多数。
Cloudflare还强调,这些流量数据来自其反Bot机制识别后的分类结果,善意爬虫(如搜索引擎索引)与恶意爬虫均被计入“自动机器人”范畴。该公司在其《2026年AI流量状况报告》中将机器人流量进一步细分为“传统自动化工具”与“AI代理”,后者在2025年下半年的增速尤为迅猛,直接推动了总量跨越50%的临界点。
AI代理崛起:从简单爬虫到拟人化操作
传统机器人通常局限于搜索引擎索引或恶意扫描,而当前驱动占比跃升的核心力量是新一代AI agent(Agentic AI)——能够模拟人类浏览行为、自主完成多步骤任务的程序。例如,用户可通过一个AI助手自动完成跨网站机票比价、从电商平台抓取商品信息并汇总,甚至代填表单与客服系统交互。这些任务过去需要用户手动操作若干个网站,现在则由一个自动程序在后台批量执行。
随着OpenAI的GPT、Google的Gemini等大模型,以及AutoGPT、Claude的Computer Use等Agent框架的普及,这类“自主代理”的数量在2025年至2026年间呈爆发式增长。HUMAN Security的报告显示,AI代理产生的请求量在2025年内增长了约400%,远超传统爬虫的增速。这些代理不仅用于个人用户,还被企业大规模部署于数据采集、客户服务、内容聚合等场景,导致其在整体HTTP请求中的权重迅速提升。
善意与恶意的边界模糊化
与以往的机器人不同,当前AI代理的行为特征更接近人类——它们会解析JavaScript、处理Cookie、模仿随机鼠标轨迹,这使得传统的反Bot策略(如CAPTCHA)难以区分。部分代理用于收集公开信息训练大模型(数据抓取),另一部分则被滥用于撞库、刷单、内容爬取等非法用途。这种混杂性给网站运营方带来识别挑战,也催生了专门针对AI流量的安全产品,如Cloudflare的Bot Management、AI Gateway等,它们尝试通过行为分析和机器学习对请求进行精细化分类。
地区分布差异:数据中心与代理服务推高比例
Cloudflare的监测揭示了机器人流量的地理分布严重不均。位于欧洲南部的直布罗陀(Gibraltar)以92.1%的机器人比例位居全球首位,新加坡和伊朗均超过76%,位列前列。这些地区通常是大型数据中心、代理服务节点或VPN集中的枢纽,大量自动化请求通过本地出口发出,从而推高了机器人占比。相比之下,以家庭宽带用户为主的区域(如部分欧洲国家)机器人比例相对较低,但整体仍在缓慢爬升。
这种不均衡对互联网服务商的运营策略产生影响——在高机器人流量地区,服务器需要分配更多资源处理自动化请求,而针对人类的体验优化(如低延迟、个性化内容)则需依赖更精准的流量识别。部分CDN提供商开始根据请求来源调整缓存策略,对已知的AI代理IP段设定单独的速率限制和资源配额。
基础设施与商业模式的连锁反应
机器人流量的激增给互联网基础设施带来可量化的压力。服务器CPU和内存资源被大量用于响应自动化请求,带宽成本随之上升,而其中相当一部分请求并不会产生任何转化收益。网站广告变现模式受到冲击——虚假流量点击和展示的泛滥干扰了效果评估,广告主与内容平台的信任成本增加。与此同时,AI代理大量抓取原创内容用于模型训练,引发了关于版权和内容价值的广泛争议。
为应对这些变化,一些内容平台已开始采取技术措施:通过robots.txt、headers或API密钥限制非人类访问;引入“AI爬虫付费墙”要求商业代理支付接入费用;以及部署更先进的实时流量分析过滤器,将推测为AI的请求导向降级响应或隔离沙箱。Cloudflare在其博客中建议企业用户定期审查Bot Analytics报告,并根据业务需求调整防火墙规则。
对普通用户与行业生态的间接影响
虽然多数用户可能感知不到底层流量构成的变化,但机器人份额的持续攀升会逐步影响上网体验。高峰时段服务器负载增大可能导致页面响应变慢,同时恶意流量的增加会推高账号盗用和欺诈风险。另一方面,AI agent也为用户带来了便利——自动比价、日程整理、表单填写等功能可节省大量重复劳动。平衡自动化红利与安全成本,正成为互联网行业在2026年面临的核心课题之一。
从更广阔的产业视角看,这一流量转折点标志着互联网从“为人设计”向“人机共存”的底层逻辑转变。API带宽、边缘计算、无服务器架构等技术因应对自动化流量而加速进化,而数据隐私法规(如GDPR、CCPA)也需考虑将非人类请求纳入更清晰的监管框架。Cloudflare CEO马修·普林斯将此举形容为“互联网的又一个‘软件吃世界’时刻”——当机器开始主动调用网络资源,人类需要重新定义流量的主人身份。
名词解释与规格科普
名词解释:
HTTP请求: 超文本传输协议(Hypertext Transfer Protocol)客户端(如浏览器或爬虫程序)向服务器发送的数据请求。每一次页面加载、图片获取或接口调用都会产生一个或多个HTTP请求。本文中Cloudflare统计的就是通过其全球网络发起的所有HTTP请求,包括GET、POST等方法。
AI代理(Agentic AI): 以大型语言模型(LLM)为核心、能够自主规划并执行多步骤任务的AI程序。不同于传统问答式AI,具备代理能力的AI可以主动调用工具(如浏览器、API)完成复杂目标,例如自动比价、在线购物、数据采集等,并能在执行过程中根据反馈调整策略。
Bot Management: Cloudflare提供的一项流量过滤服务,通过机器学习模型和指纹识别技术区分人类用户、善意爬虫与恶意机器人,允许运营方对不同类型的请求执行不同的处理策略(如放行、减速、拦截),帮助网站管理员在保障访问体验的同时,防范自动化滥用。
本文参考来源:Ubergizmo
微信扫描下方的二维码阅读本文



