Google Gemini Agent Surface

What it is

这里指的是 Gemini API 面向 agent 的能力集合,而不是某一个单独 SDK。当前文档把 agents、tools、Live API、function calling、context caching、computer use、file search 都放在同一个产品面里。

Current shape

从公开文档首页看,Gemini API 当前强调几类 agent 关键能力:

  • Function calling:把外部 API 与工具接进 agent workflow
  • Tools:内建 Google Search、URL Context、Maps、Code Execution、Computer Use、File Search
  • Live API:用于实时语音应用与 voice agents
  • Context caching:优化长上下文与重复上下文成本

Why it matters

Google 并没有把所有 agent 能力都塞进 ADK;相反,Gemini API 自己已经提供了一层偏产品化的 agent capability surface,而 ADK 再往上处理开发与部署问题。

Relationships

  • google 的 agent 能力由 Gemini API 与 google-adk 共同构成
  • responses-api 相比,它更像“能力总面板”而非单一底层接口
  • anthropic-tool-use 相比,它的内建工具面更产品化、更 Google 生态化