文章詳情頁

python錄音并調用百度語音識別接口的示例

瀏覽：4日期：2022-07-03 14:41:13

#！/usr/bin/env pythonimport requestsimport jsonimport base64import pyaudioimport waveimport osimport psutil#首先配置必要的信息def bat(voice_path): baidu_server = ’https://aip.baidubce.com/oauth/2.0/token?’ grant_type = ’client_credentials’ client_id = ’uj70rS1LiwZ9sQDvMSUqKsie’ #API KEY client_secret = ’Q88eav41PzeNLczZ3hlRjhR8e4WShXwD’ #Secret KEY 這里可以自己去百度注冊，這里是我的API KEY 和 Secret KEY #合成請求token的url url = baidu_server+’grant_type=’+grant_type+’&client_id=’+client_id+’&client_secret=’+client_secret #獲取token res = requests.get(url).text data = json.loads(res) token = data[’access_token’] #設置音頻的屬性，采樣率，格式等 VOICE_RATE = 8000 FILE_NAME = voice_path # USER_ID = ’16241950’ #這里的id隨便填填就好啦，我填的自己昵稱 FILE_TYPE = ’wav’ CUID='wate_play' #讀取文件二進制內容 f_obj = open(FILE_NAME, ’rb’) content = base64.b64encode(f_obj.read()) # 百度語音識別需要base64編碼格式 speech = content.decode('utf-8') size = os.path.getsize(FILE_NAME) #json封裝 datas = json.dumps({ ’format’: FILE_TYPE, ’rate’: VOICE_RATE, ’channel’: 1, ’cuid’: CUID, ’token’: token, ’speech’: speech, ’len’: size, 'dev_pid':'1536' }) return datas#設置headers和請求地址urldef post(datas): headers = {’Content-Type’:’application/json’} url = ’https://vop.baidu.com/server_api’ # url = 'http://vop.baidu.com/server_api' #用post方法傳數據 request = requests.post(url, datas, headers) result = json.loads(request.text) text = result.get('result') if result[’err_no’] == 0: return text else: return 'Error'def get_audio(filepath): input('回車開始錄音 >>>') #輸出提示文本，input接收一個值,轉為str，賦值給aa CHUNK = 256 #定義數據流塊 FORMAT = pyaudio.paInt16 #量化位數（音量級劃分） CHANNELS = 1# 聲道數;聲道數：可以是單聲道或者是雙聲道 RATE = 8000# 采樣率;采樣率：一秒內對聲音信號的采集次數，常用的有8kHz, 16kHz, 32kHz, 48kHz, 11.025kHz, 22.05kHz, 44.1kHz RECORD_SECONDS = 5 #錄音秒數 WAVE_OUTPUT_FILENAME = filepath #wav文件路徑 p = pyaudio.PyAudio()#實例化 stream = p.open(format=FORMAT, channels=CHANNELS, rate=RATE, input=True, frames_per_buffer=CHUNK) print('*'*10, '開始錄音：請在5秒內輸入語音') frames = [] #定義一個列表 for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)): #循環，采樣率11025 / 256 * 5 data = stream.read(CHUNK)#讀取chunk個字節保存到data中 frames.append(data) #向列表frames中添加數據data # print(frames) print('*' * 10, '錄音結束n') stream.stop_stream() stream.close() #關閉 p.terminate() #終結 wf = wave.open(WAVE_OUTPUT_FILENAME, ’wb’) #打開wav文件創建一個音頻對象wf，開始寫WAV文件 wf.setnchannels(CHANNELS) #配置聲道數 wf.setsampwidth(p.get_sample_size(FORMAT)) #配置量化位數 wf.setframerate(RATE) #配置采樣率 wf.writeframes(b’’.join(frames)) #轉換為二進制數據寫入文件 wf.close() #關閉 returndef check_disk(): list_drive = psutil.disk_partitions() # 找出本地磁盤列表，保存的是結構體對象 list_disk = [] for drive in list_drive: list_disk.append(drive.device) return list_diskif __name__ == ’__main__’: list_disk = check_disk() # 檢索本地磁盤 dirname_path = os.path.join(list_disk[0], 'voice') # 設置語音文件存放路徑，（mac os下需要自己定存儲路徑） if not os.path.exists(dirname_path): os.makedirs(dirname_path) filename = 'voice.wav' # 定義語音文件名 in_path = os.path.join(dirname_path, filename) get_audio(in_path) # 錄音 datas = bat(in_path) # 封裝百度語音識別需要的配置信息，返回請求頭 res = post(datas) # 連接百度語音識別接口，得到識別結果 print('識別結果：',res[0])

實現效果：

在上述代碼中，需要裝到requests、psutil、pyaudio等庫，其中pyaudio這個庫在python3環境下裝比較特殊，

windows環境下具體步驟如下：

第一步：下載whl文件支持

url：https://www.lfd.uci.edu/~gohlke/pythonlibs/#pyaudio

python錄音并調用百度語音識別接口的示例

注意：

下載自己python解釋器對應版本的

不要下載錯了，資源很多

第二步：打開cmd，cd 進入下載的whl所在目錄

執行命令：pip install Twisted-18.7.0-cp36-cp36m-win_amd64.whl # 下載的什么版本，后面就跟什么版本

第三步：執行命令：pip install pyaudio 安裝

如果本地同時裝有python2和python3，想裝到python3里可以在cmd命令里把 pip 改成 pip3 即可

mac os 下安裝pyaudio步驟如下：

python錄音并調用百度語音識別接口的示例

到這里就結束啦！

以上就是python錄音并調用百度語音識別接口的示例的詳細內容，更多關于python 錄音并調用語音識別接口的資料請關注好吧啦網其它相關文章！

百度 Python

上一條：Python用摘要算法生成token及檢驗token的示例代碼下一條：Python爬蟲簡單運用爬取代理IP的實現

相關文章：

1. ajax請求添加自定義header參數代碼2. ASP基礎知識VBScript基本元素講解3. Python requests庫參數提交的注意事項總結4. Kotlin + Flow 實現Android 應用初始化任務啟動庫5. Gitlab CI-CD自動化部署SpringBoot項目的方法步驟6. 詳談ajax返回數據成功卻進入error的方法7. 利用CSS3新特性創建透明邊框三角8. ASP中解決“對象關閉時,不允許操作。”的詭異問題……9. asp知識整理筆記4（問答模式）10. 淺談SpringMVC jsp前臺獲取參數的方式 EL表達式

排行榜

					
					ASP基礎知識VBScript基本元素講解
ajax請求添加自定義header參數代碼
Gitlab CI-CD自動化部署SpringBoot項目的方法步驟
Kotlin + Flow 實現Android 應用初始化任務啟動庫
Python requests庫參數提交的注意事項總結
基于javascript處理二進制圖片流過程詳解
SpringBoot參數校驗與國際化使用教程
idea開啟代碼提示功能的方法步驟
利用CSS3新特性創建透明邊框三角
python pymysql鏈接數據庫查詢結果轉為Dataframe實例
詳談ajax返回數據成功 卻進入error的方法
				

熱門標簽