Google Gemini Agent Surface
What it is
这里指的是 Gemini API 面向 agent 的能力集合,而不是某一个单独 SDK。当前文档把 agents、tools、Live API、function calling、context caching、computer use、file search 都放在同一个产品面里。
Current shape
从公开文档首页看,Gemini API 当前强调几类 agent 关键能力:
- Function calling:把外部 API 与工具接进 agent workflow
- Tools:内建 Google Search、URL Context、Maps、Code Execution、Computer Use、File Search
- Live API:用于实时语音应用与 voice agents
- Context caching:优化长上下文与重复上下文成本
Why it matters
Google 并没有把所有 agent 能力都塞进 ADK;相反,Gemini API 自己已经提供了一层偏产品化的 agent capability surface,而 ADK 再往上处理开发与部署问题。
Relationships
- google 的 agent 能力由 Gemini API 与 google-adk 共同构成
- 与 responses-api 相比,它更像“能力总面板”而非单一底层接口
- 与 anthropic-tool-use 相比,它的内建工具面更产品化、更 Google 生态化