openai whisper模型现已在microsoft的azure openai服务和azure ai speech服务中可用-凯发k8一触即发

microsoft-openai-service

microsoft就宣布 whisper模型将很快出现在 openai服务中。上周五,microsoft宣布openai whisper模型现在可供使用azure openai服务和azure ai speech服务的客户使用。

openai 耳语模型是一个神经网络,可以用 57 种语言执行识别和翻译任务。它是在从网络收集的大量多样化的音频和文本数据集上进行训练的。它使用基于变压器编码器-解码器架构的简单端到端方法,并且可以生成具有增强可读性和短语级时间戳的成绩单。

企业现在可以使用以下两种方式构建基于 openai whisper 模型的应用程序:

azure openai 服务中的 openai 耳语模型:

openai已经自己提供了whisper api。使用这个新的azure openai服务,开发人员可以在特性和功能(包括转录和翻译功能)中使用相同的openai whisper api。可以在 azure openai 服务门户中找到 whisper 模型的用于听录和转换的 rest api。

azure ai 语音中的 openai 耳语模型:

azure ai 语音的用户现在可以将新的 openai 的耳语模型与现有的 azure ai 语音批量听录 api 结合使用。azure ai 语音中的 whisper 用户受益于现有功能,包括异步处理、说话人分割、自定义和更大的文件大小。在下面找到详细信息。

  • 大文件大小:azure ai 语音通过启用最大 1gb 的文件来增强耳语听录,并通过允许在单个请求中批处理多达 1000 个文件来处理大量文件的能力。
  • 时间戳: 使用 azure ai 语音,识别结果包括字级时间戳,从而能够识别音频中每个字词的发音位置。
  • 扬声器分割:这是 azure ai 语音的另一个有益功能,可识别音频文件中的各个说话人并标记其语音段。此功能允许客户区分说话者,准确转录他们的话,并创建更有条理和结构化的音频文件转录。
  • 自定义/微调(即将推出):azure 语音中的自定义语音功能允许客户对自己的数据微调 whisper,以提高识别准确性和一致性。

原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/yun256316.html

(0)
打赏 微信扫一扫不于多少! 微信扫一扫不于多少! 支付宝扫一扫礼轻情意重 支付宝扫一扫礼轻情意重
上一篇 2023年9月18日 下午8:21
下一篇 2023年9月18日

相关推荐

  • 经过几个月的延迟,openai 终于向 gpt store 敞开了大门——这是一个供用户查找用户创建的流行自定义版本的 chatgpt 的平台。 自引入自定义 gpt 构建器以来,…

    2024年1月15日
  • 经过几个月的延迟,openai 终于向 gpt store 敞开了大门——这是一个供用户查找用户创建的流行自定义版本的 chatgpt 的平台。 自引入自定义 gpt 构建器以来,…

    2024年1月12日
  • open ai将成为美国二大最有价值的初创公司,仅次于spacex 上周有消息说openai正在初步讨论以1000亿美元或以上的估值筹集新一轮资金,同时2023年的利润将会达到16…

    2024年1月2日
  • chatgpt 是 openai 的革命性语言模型,风靡全球。它能够生成逼真的文本、翻译语言、编写不同类型的创意内容以及以信息丰富的方式回答您的问题,开辟了一个充满可能性的新时代。…

    2023年12月29日
  • microsoft正在扼杀 windows 11 上的 windows vista 时代的语音识别

    microsoft 将在即将发布的 windows 11 中结束对 windows 语音识别功能的支持。借助语音识别,您可以教操作系统理解您的声音并打开应用程序或口述命令,但现在是…

    2023年12月25日
  • chatgpt 的语音功能现已面向所有免费用户开放。意味着无需支付任何费用,就能与 chatgpt 进行自然的对话,体验犹如与真人交流一般的奇妙互动。 在 google play …

    2023年12月21日
  • 在过去的一年里,人工智能 (ai) 在科技领域取得了长足的进步,改变了我们与数字设备和内容互动的方式。openai、microsoft、谷歌等主要科技公司在 2023 年一直处于这…

    2023年12月21日
  • runway :上线文字生成语音功能 尝试了一下英文的效果真的很好,感情很丰富自然。中文还是老问题,有外国人口音,这块可能不能指望外国公司了。这个功能可以选的语音模型非常多,可以都…

    2023年12月19日
  • microsoft 通过其新的 ai 模型即服务增强了 azure ai 功能,在人工智能领域向前迈出了重要一步。microsoft 在扩展其 ai 产品方面取得了长足的进步,包括…

    2023年12月15日
  • meta 本月推出了一款名为 audiobox 的新 ai 声音发生器,它将改变我们与声音互动的方式。这个创新工具允许用户使用简单的文本提示轻松将文本转换为语音、创作音乐和创建声音…

    2023年12月14日
  • 在移动设备领域,苹果的iphone是先驱,将尖端技术与用户友好的设计无缝集成。这种集成的核心是 siri,这是 apple 的创新语音助手。siri 彻底改变了用户与 iphone…

    2023年12月12日
  • azure ai studio 为用户提供了一个用于开发和部署生成式 ai 应用程序的综合平台。提供单一平台方法来构建和部署 ai 自定义副驾驶。以及提供许多不同的ai模型,包括来…

    2023年12月12日
  • turnvoice 是一个命令行工具,可以转换和翻译 youtube 视频中的声音。它提供了语音转换和语音翻译的功能,可以替换特定的发言人声音,支持本地文件处理,并保留原始背景音频…

    工具软件 2023年12月12日
  • 你有一本想变成有声读物的书吗?或者其他需要您提供画外音的项目,例如媒体内容、视频、营销材料等?加快编辑和创作工作流程的一种可能方法是使用人工智能 (ai) 克隆您的声音。 desc…

    2023年12月10日
  • 语音消息是简单文本消息的一个很好的替代品。但是,每次收到私人语音消息时,摸索耳机可能会很累。如果你是telegram用户,幸运的是,有一个简单的出路。telegram 现在可以自动…

    2023年12月6日 技术教程
  • google ai 的研究人员开发了一种名为 translatotron 3 的新 ai 模型,可以将口语从一种语言翻译成另一种语言,而无需任何并行语音数据。这可以把你变成一个实时…

    2023年12月2日
  • chatgpt 上线 2022 年 11 月 30 日,openai 向全世界免费推出了 chatgpt,作为研究预览的一部分。在短短两个月的时间里,它积累了超过1亿的月度用户,成…

    2023年12月2日 工具软件
  • openai 正式宣布 sam altman 回归担任首席执行官 在过去几周的惨败之后,openai正在经历重大的领导层变动,sam altman恢复了首席执行官的职位,mira …

    2023年12月1日
  • 在快节奏的人工智能 (ai) 世界中,拥有强大而强大的基础设施至关重要,尤其是在使用复杂的机器学习模型(如自然语言处理中使用的模型)时。microsoft azure 处于这一技术…

    2023年11月29日
  • elevenlabs本周以speech to speech的形式发布了其人工智能语音操作和增强工具系列的新功能。使其 ai 模型能够捕捉您声音的独特品质并以数字方式复制它,从而创建…

    2023年11月28日
  • 由于人工智能的爆炸式增长,现在可以创建人工智能助手来帮助完成这些平凡的任务,使您能够专注于业务或个人生活中更重要的领域。如果您想了解如何将 openai assistant api…

    2023年11月28日
  • 在快节奏的人工智能 (ai) 世界中,拥有强大而强大的基础设施至关重要,尤其是在使用复杂的机器学习模型(如自然语言处理中使用的模型)时。microsoft azure 处于这一技术…

    2023年11月28日
  • chatgpt将语音功能开放给所有免费用户,成为在人员大震动之后的首个重要更新。用户只需下载最新版本的客户端,即可直接体验这一引人瞩目的语音功能。为用户提供更加多样化、自然的交互体…

    2023年11月27日
  • openai load balancer:open ai api 负载均衡 它是一个python库,用于在多个端点之间分配api请求(支持openai和azure)。它实现了轮询负…

    2023年11月27日
  • openai 对其 chatgpt 平台进行了重大更新,使所有用户都可以免费使用语音功能。这一重大增强功能允许用户使用语音与 chatgpt 互动,这是以前仅限于付费订阅者的功能。…

    工具软件 2023年11月23日
淘宝       
网站地图