Speech-to-Text 可以利用
Chirp
,这是 Google Cloud 的语音基础模型,使用数百万小时的音频数据和数十亿个文本句子训练而成。这与传统语音识别技术(侧重于大量特定于语言的监督数据)形成了鲜明对比。这些技术可以为用户提高
识别和转录
能力,从而更好地理解口语和口音。
支持 125 种语言和语言变体
通过
广泛的语言支持
打造全球用户群。转录短音频、长音频甚至流式传输的音频数据。Speech-to-Text 还利用新一代通用语音模型 Chirp,为用户提供更加准确、
覆盖全球的翻译和识别
。Chirp 使用数百万小时的音频和 280 亿个句子的文本(涵盖 100 多种语言)的自监督训练构建而成。
2. 用于转写的预训练模型或可自定义的模型
从
多种经过训练的模型
中进行选择,实现优化的语音控制、电话和视频转录,满足特定领域的质量要求。通过
Speech-to-Text 界面
,轻松自定义、试验、创建和管理自定义资源。
3. 开箱即用的监管和安全合规性
无需额外设置,Speech-to-Text API v2 即可帮助企业客户满足额外安全和监管要求。
数据驻留
支持通过完全区域化的服务(该服务接入至新加坡和比利时等 Google Cloud 区域)来调用转录模型。借助
识别器应变性 (resourcefulness)
,您无需使用专用服务账号进行身份验证和授权。您可以在 Google Cloud 控制台中轻松查看关于资源生成和转写的日志。Speech-to-Text API v2 为所有资源以及批量转录提供使用
客户管理的加密密钥
的企业级加密。
4. AI 赋能的语音识别和转录
Speech-to-Text 使用
模型自适应
技术来提高常用字词的准确性、扩充可用于转录的词汇,并改善嘈杂音频的转录效果。模型自适应可让用户自定义 Speech-to-Text,使其能够更频繁地使用同音字词中的某一个而非建议的其他选项。例如,您可以让 Speech-to-Text 在转录时更多地使用“时常”而不是“时长”。
凭借 AI 技术,保障出色的翻译质量以及企业级的控制和安全性。
运用 Google 的神经机器翻译技术,支持使用预训练的自定义模型或专用大语言模型(LLM)进行动态翻译。
设有基础和高级版本,高级版具备特定的自定义功能。
每月为用户提供前 500,000 个字符(基础版和高级版总计)的免费处理额度(LLM 除外)。
1. 创建或选择项目
如需使用 Google Cloud 提供的服务,您必须创建一个项目。项目用于组织您的所有 Google Cloud 资源。 项目由一组协作者、已启用的 API(和其他资源)、监控工具、结算信息以及身份验证和访问权限控制组成。您可以创建一个项目,也可以创建多个项目,并使用这些项目按
资源层次结构
组织 Google Cloud 资源。创建项目时,请记下
项目 ID
。您需要此 ID 才能进行 API 调用。 如需详细了解项目,请参阅
Resource Manager 文档
。
2. 启用结算功能
您必须启用结算功能才能使用 Cloud Translation。如需详细了解 Cloud Translation 价格,请参阅
价格页面
。
3. 启用 API
您必须为项目启用 Cloud Translation API。如需详细了解如何启用 API,请参阅
Service Usage 文档
。
启用 Cloud Translation API。
4. 设置用量配额
Cloud Translation 提供了配额管理系统,可帮助您和 Google 管理服务的使用。默认情况下,您每天可以发送的字符数没有限制。如果您设置了预算,则建议您监控每日使用量,并根据您计划的支出调整配额。
如需详细了解配额,请参阅
配额和限制
。
5. 设置身份验证
如果您计划使用 Cloud Translation API,则需要设置身份验证。任何使用 API 的客户端应用都必须经过身份验证,并且拥有所请求资源的访问权限。如需了解详情,请参阅
向 Cloud Translation 进行身份验证
。
Identity and Access Management 角色
当主账号(用户账号、服务账号等)调用 API 时,Google Cloud 要求主账号具有适当的权限。您可以通过向主账号授予角色来授予权限。如需了解详情,请参阅
使用 IAM 控制访问权限
。
指南详情链接:https://cloud.google.com/translate/docs/setup?hl=zh-cn
1. 创建或选择项目
如需使用 Google Cloud 提供的服务,您必须创建一个项目。项目用于组织您的所有 Google Cloud 资源。 项目由一组协作者、已启用的 API(和其他资源)、监控工具、结算信息以及身份验证和访问权限控制组成。您可以创建一个项目,也可以创建多个项目,并使用这些项目按
资源层次结构
组织 Google Cloud 资源。创建项目时,请记下
项目 ID
。您需要此 ID 才能进行 API 调用。 如需详细了解项目,请参阅
Resource Manager 文档
。
2. 启用结算功能
您必须启用结算功能才能使用 Cloud Translation。如需详细了解 Cloud Translation 价格,请参阅
价格页面
。
3. 启用 API
您必须为项目启用 Cloud Translation API。如需详细了解如何启用 API,请参阅
Service Usage 文档
。
启用 Cloud Translation API。
4. 设置用量配额
Cloud Translation 提供了配额管理系统,可帮助您和 Google 管理服务的使用。默认情况下,您每天可以发送的字符数没有限制。如果您设置了预算,则建议您监控每日使用量,并根据您计划的支出调整配额。
如需详细了解配额,请参阅
配额和限制
。
5. 设置身份验证
如果您计划使用 Cloud Translation API,则需要设置身份验证。任何使用 API 的客户端应用都必须经过身份验证,并且拥有所请求资源的访问权限。如需了解详情,请参阅
向 Cloud Translation 进行身份验证
。
Identity and Access Management 角色
当主账号(用户账号、服务账号等)调用 API 时,Google Cloud 要求主账号具有适当的权限。您可以通过向主账号授予角色来授予权限。如需了解详情,请参阅
使用 IAM 控制访问权限
。
指南详情链接:https://cloud.google.com/translate/docs/setup?hl=zh-cn