React-Native 使用 expo-av IOS 录制的 mp4 文件形式数据调用 openai 的音频转录，表示文件格式无效

2023-12-19

我整晚都在做这个，我试图使用 expo-av（通过 iPhone 记录语音）在我的 iPhone 上通过 expo 录制自己的声音，并使用 Whisper-1 模型将其上传到 openai 的转录端点。

该文件保存为mp4，我将其转换为base64字符串，我已确认base64内容实际上是mp4：

Base64 转文件工具

上传和检查文件工具

这是反应本机代码：

  const recordingOptions = {
    android: {
      extension: ".mp4",
      outputFormat: Audio.AndroidOutputFormat.MPEG_4,
      audioEncoder: Audio.AndroidAudioEncoder.AAC,
      sampleRate: 44100,
      numberOfChannels: 2,
      bitRate: 128000,
    },
    ios: {
      extension: ".mp4",
      // outputFormat: Audio.IOSOutputFormat.MPEG4AAC,
      audioQuality: Audio.IOSAudioQuality.HIGH,
      sampleRate: 44100,
      numberOfChannels: 2,
      bitRate: 128000,
    },
    web: {
      mimeType: "audio/mp4",
      bitsPerSecond: 128000 * 8,
    },
  };

实际执行：

const recordingUri = recording.getURI();
      const recordingBase64 = await ExpoFileSystem.readAsStringAsync(
        recordingUri,
        {
          encoding: ExpoFileSystem.EncodingType.Base64,
        }
      );
      const languageCode = "en"; // English
      console.log(languageCode);
      console.log(recordingBase64)

      const buffer = Buffer.from(recordingBase64, "base64")
      const blob= new Blob([buffer], { type:'audio/mp4' })
      const file = new File([blob],'test.mp4', {type:'audio/mp4'})



      const formData = new FormData();
      formData.append('file',file);
      formData.append("model", "whisper-1");

      const apiUrl = "https://api.openai.com/v1/audio/transcriptions";

      const requestOptions = {
        method: "POST",
        headers: {
          Authorization: `Bearer ${OPENAI_API_KEY}`,
        },
        body: formData,
      };

      fetch(apiUrl, requestOptions)
        .then((response) => response.json())
        .then((data) => console.log(data))
        .catch((error) => console.log(error));

每次的响应都是：

{"error": {"code": null, "message": "Invalid file format. Supported formats: ['m4a', 'mp3', 'webm', 'mp4', 'mpga', 'wav', 'mpeg']", "param": null, "type": "invalid_request_error"}}

有谁知道我做错了什么？

尝试添加一个filename to the formData.append。与此类似的东西：

formData.append('file', file, 'input.mp4');

Whisper 不应该依赖扩展，但看起来确实如此。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

typescript

ReactNative

API

Expo

openaiapi

React-Native 使用 expo-av IOS 录制的 mp4 文件形式数据调用 openai 的音频转录，表示文件格式无效的相关文章

type-graphql：如何知道Resolver返回了哪些字段

我正在编写一个使用 type graphql 的后端应用程序 GraphQL 架构包括Folder键入如下所示 type Folder id ID name String rules Rule parent Group Rule and G
彭博开放 API

彭博开放 API最近宣布 http www computerworlduk com news it business 3334375 bloomberg market data api made public 这只是彭博软件开发工具包 ht
React Native：“React”指的是 umd 全局文件，但当前文件是一个模块，请考虑添加导入

我在添加时遇到此错误View组件在 tsx file 我提出这个问题并回答自己因为我认为这会帮助面临类似问题的其他人请导入React在您的代码导入语句中 import as React from react 参考 https githu
如果函数声明时没有使用“const”关键字，函数调用签名会出错

我是 TypeScript 新手正在学习中呼叫签名 https www typescriptlang org docs handbook 2 functions html call signatures 如果我将函数存储为let or c
联合数据类型上的条件数据类型

假设您有以下类型 type Foo prop1 foo prop2 null type Bar prop1 bar prop2 number type FooOrBar Foo Bar 是否可以使用条件类型重写上述代码我已经尝试过以下方法
为现有模块创建 d.ts 文件

我正在尝试创建一个d ts文件为React 静态容器 https github com reactjs react static container图书馆 NPM 中安装的库如下所示 var React require react var
ReactNative - 未处理的 JS 异常：SyntaxError

当我尝试在 iOS 8 上启动 RUN 应用程序时出现这个奇怪的错误 Unhandled JS Exception SyntaxError仅此而已不再有更多信息有any1偶然发现这个问题吗在 iOs 9 上应用程序运行正常 x代码版
使用yarn 2工作区在monorepo中的两个项目之间共享打字稿代码

我想在打字稿中建立一个包含客户端部分 react app 服务器部分 express 和共享库 utils 的项目我使用yarn 2工作区并希望避免使用larna 如果可能的话不幸的是几天以来我一直无法让它工作并且进行了大量的谷歌搜
如何更改 Angular Material 选择中的滚动条样式？

我们需要帮助来更改 Angular Material 的 Select 组件中的滚动条实现了以下演示 https stackblitz com angular bxbvndrpogl file app 2Fselect reset exa
React Native Android 发布 apk 是调试，而不是发布

我有一个现有的 Android 应用程序我已根据以下内容将 React Native v0 30 活动添加到项目中docs http facebook github io react native releases next docs i
Angular 6 中的 Http 错误处理

我正在尝试使用 Angular 6 中的以下类来处理 http 错误我从服务器收到 401 未经授权状态但我没有看到控制台错误消息 HttpErrorsHandler ts 文件 import ErrorHandler Injectab
React Native 扩展 NativeModules TypeScript 类型

我有一个本机模块我想输入它这是我的模块界面的示例 export interface BBAudioPlayer playSound sound click tada gt Promise
如何为 ApplicationController 中 after_action 过滤器中的所有操作渲染 json？

是否可以在 Rails ApplicationController 中创建一个 after filter 方法该方法在每个操作上运行并呈现为 JSON 我正在构建一个 API 并且希望将控制器中的每个操作的输出呈现为 JSON 客户控制器
尝试创建发布包时无法解析模块“AccessibilityInfo”

我在跑步 react native bundle platform windows dev false entry file index windows js bundle output windows app ReactAssets in
React Native glog iOS：未知类型名称“_START_GOOGLE_NAMESPACE_”

我已经构建了一个 React Native 的 Android 项目它运行良好然后我开始了 iOS 部分我正在使用react native cli 2 0 1react native 0 60 4和Xcode 10和Mac OS Mo
带有 OAuth2 的 YouTube API v3：更新和删除失败并出现“权限不足”错误

我在尝试着update and delete视频使用YouTube API v3 https developers google com youtube v3 docs videos with OAuth2 用于身份验证 https dev
Angular 4 过滤器搜索自定义管道

所以我试图构建一个自定义管道来在 ngFor 循环中执行多个值的搜索过滤器我花了几个小时寻找一个好的工作示例其中大多数都是基于以前的版本并且似乎不起作用所以我正在构建管道并使用控制台为我提供值但是我似乎无法显示输入文本以下是我
使用 PHP 和 OAuth 访问 SkyDrive

我想使用 PHP 访问 skyDrive 我想检索文件和文件夹列表下载上传和删除文件我有一个 microsoft dev clientID 和 clientSecret 有人可以帮助我开始使用 OAuth 连接到 skyDrive 并
在现有 iOS 应用程序中集成 React-native(0.40.0) 后找不到 Yoga/Yoga.h 头文件

在我的 Swift iOS 应用程序中集成 React Native 后我无法构建 yoga Yoga h file cannot be found 我已经浏览了文档查看了react native github页面检查了类似问题的SO
注册期间现有电子邮件的 422 或 409 状态代码

我正在构建 RESTful API 遇到了一种情况在用户注册期间如果电子邮件已存在则在422 and 409哪个http响应代码有意义我浏览过类似的one https stackoverflow com questions 9269

随机推荐

Spring Data中的多态查询

我有一个基本抽象类 Entity Table name P FLD Inheritance strategy InheritanceType JOINED DiscriminatorColumn name FLD DISCRIMINATOR
当应用程序被销毁时 PreferenceActivity 保存首选项

我有一个 MainActivity 和一个从该 Activity 调用的 PreferenceActivity 我还运行了一个服务来查询这些首选项当我打印这些值时我明白了 D pref scrobble 4083 true D pref
Git 挂钩，通过提交进行接收后循环

在服务器端使用 git hooks 是否可以在每次有人推送到远程存储库时循环从客户端发送到服务器的新提交消息我需要从每条消息中提取信息哈希日期提交作者分支我找不到任何关于 git hooks 的好的文档来解决这个问题我已读完g
保存和读取登录到钥匙串不工作 IOS swift

Hello I have a log in view that uses face recognition to authenticate the user and If the user is authenticated it reads
矢量图块缓冲区

我在使用 Geoserver 提供的矢量切片设置 Openlayers 地图时遇到问题线条沿着瓷砖的边缘拧在一起看起来线条是先被剪裁然后再设计样式而不是相反这使得宽线看起来很难看更改 LOL 客户端中的渲染缓冲区不会产生任何影响
pandas dataframe groupby：仅正数的总和/计数

我有一个数据框框架我想按国家和日期进行聚合 aggregated pd DataFrame frame groupby Country Date CaseID count aggregated Total duration frame
Git 子模块跟踪提交但知道分支？

我正在一个项目中工作我们使用 git 子模块来跟踪整个代码一起发布的几个不同部分所以我喜欢子模块跟踪特定提交的想法因为子模块主要用于历史目的这很好这样将来人们就可以检查超级存储库的特定标签并找出每个组件的代码所在的位置但是如
消息队列与任务队列的区别

我想知道它们之间有什么区别他们描述的是同一件事吗是 Google App Engine 服务任务队列 https developers google com appengine docs java taskqueue overview是
无法在 Excel for Mac 2016 中加载 macOS 连接器/MySQL ODBC 驱动程序

我正在 High Sierra 10 13 6 上使用 Excel for Mac 版本 16 18 安装了适用于 macOS 的 Connector ODBC 8 0 12 使用 iODBC 数据源管理 64 位测试了与我的数据库的连接
Xcode：添加项目作为构建依赖项

我正在玩声音云API https github com soundcloud cocoa api wrapper tree oauth2 在其说明中说将 SoundCloudAPI xcodeproj 拖到您的项目中将其添加为构建依赖项
django（rest_framework）中的令牌身份验证不起作用

标题基本概括了所有内容我正在尝试使用令牌进行身份验证我正在从 django 数据库获取信息到我的 flutter 应用程序我已成功从rest framework 检索我的令牌并将其添加到其余请求的标头中我在 django 中打印了这
ApiController 扩展方法 - 无法访问 ResponseMessage

我想为 ApiController 创建扩展方法以便能够返回自定义内容我的想法是用我自己的详细信息返回自定义错误我想返回类似于返回的错误的自定义错误OAuthAuthorizationServerProvider error inval
ggplot：一种颜色/类别的多条线

我正在尝试将多条线绘制为 ggplot2 中单个类的一部分我可以绘制如下所示的内容但我的问题是我想将 n1 n2 和 n3 显示为单个类图例中每个类都有一个名称的灰色细线我的问题是如果我在数据框中创建一个新因素以便对它们进行分
为什么哈希表扩展通常通过将大小加倍来完成？

我对哈希表做了一些研究并且我一直遵循经验法则即当存在一定数量的条目最大数量或通过负载因子例如 75 时应该扩展哈希表几乎总是建议将哈希表的大小加倍或加倍加 1 即 2n 1 然而我一直没能找到一个很好的理由为什么要加倍大小
为列表框中的每个项目加载不同的数据模板

我正在尝试创建一个学习应用程序我想根据问题类型加载数据模板如下所述 If Question Type is TYPE1 load InstructionTemplate Type1 xaml load ChoiceTemplate Ty
海龟图形 begin_fill() 函数在 MAC 上无法正常工作

我正在尝试使用模块turtle 绘制一颗黄色星星当我在 Windows 操作系统上运行我的程序时它可以正常工作但是当我在 macOS 上运行它时图形是错误的 macOS 上的结果 https i stack imgur com
ES6 中添加方法到类中带箭头符号和不带箭头符号有什么区别？

我最近遇到了两种在 javascript ES6 中向类添加方法的方法简而言之 class SomeClass someMethod arg console log this anotherMethod This will produce
使用生成器创建范围内数字的平方幂列表

我想使用生成器重写这部分代码 basic for x in range 0 11 basic append x 2 我怎样才能做到这一点尝试过 basic append x 2 for x in range 0 11 但它会引发语法错误x
打开 pdf 文件时，TwebBrowser 缩放/手势不适用于 XE4 中的 firemonkey/iO

我想在 iOS 应用程序中显示 PDF 到目前为止我找到的唯一方法是在 TwebBrowser 中打开它 A 默认以适合页面宽度缩放显示 B 没有缩放功能 WebBrowser1 Navigate file mypdf pdf Ho
React-Native 使用 expo-av IOS 录制的 mp4 文件形式数据调用 openai 的音频转录，表示文件格式无效

我整晚都在做这个我试图使用 expo av 通过 iPhone 记录语音在我的 iPhone 上通过 expo 录制自己的声音并使用 Whisper 1 模型将其上传到 openai 的转录端点该文件保存为mp4 我将其转换为bas

React-Native 使用 expo-av IOS 录制的 mp4 文件形式数据调用 openai 的音频转录，表示文件格式无效

React-Native 使用 expo-av IOS 录制的 mp4 文件形式数据调用 openai 的音频转录，表示文件格式无效 的相关文章

随机推荐

热门标签

React-Native 使用 expo-av IOS 录制的 mp4 文件形式数据调用 openai 的音频转录，表示文件格式无效的相关文章