기본 콘텐츠로 건너뛰기

Google Cloud Speech 음성인식 API python, nodejs

Google Cloud Speech 음성인식 API python, nodejs

Jeongchul

김정출 김정출 2017. 8. 29. 00:46

Google Cloud Speech 음성인식 API python, nodejs

Google Cloud 프로젝트 생성하기

https://cloud.google.com/speech/

웹 사이트로 이동하여 VIEW CONSOLE 흰색 버튼을 클릭합니다.

상단부 메뉴에 프로젝트를 클릭합니다.

다음에 뜬 팝업창에서 + 버튼을 클릭합니다.

새 프로젝트에서 프로젝트 이름을 입력하고 '만들기' 파란색 버튼을 클릭합니다.

이후에 생성된 프로젝트로 이동합니다.

사이드 메뉴에서 APIs and Services 버튼을 클릭하고 Dashboard로 이동합니다.

대시보드 옆에 ENABLE APIS AND SERVICES 버튼을 클릭합니다.

Google Cloud 기계 학습

Speech API 파란색 버튼을 클릭합니다.

'사용 설정' 파란색 버튼을 클릭합니다.

'사용 중지' 버튼을 클릭하면 Google Cloud Speech API 사용을 중지합니다.

사이드 메뉴에서 '사용자 인증 정보' 버튼을 클릭합니다.

Google Cloud Speech API

https://console.cloud.google.com/flows/enableapi?apiid=speech.googleapis.com

다음의 사이트에서 위에서 만든 프로젝트를 선택하고 '계속' 파란색 버튼을 클릭합니다.

'사용자 인증 정보로 이동' 파란색 버튼을 클릭합니다.

Google Cloud Speech API를 선택하고

Google Compute Engine을 사용 중인가요에 예를 선택하고

'어떤 사용자 인증 정보가 필요한가요?' 파란색 버튼을 클릭합니다.

'완료'의 파란색 버튼을 추가합니다.

OAuth 클라이언트 ID를 만들기 위해서 제품 이름을 설정해야 합니다.

'동의 화면 구성'의 파란색 버튼을 클릭합니다.

제품 이름을 입력합니다. '저장' 파란색 버튼을 클릭합니다.

애플리케이션 유형에서 웹 애플리케이션을 선택하고, 이름을 입력합니다.

'생성'의 파란색 버튼을 클릭합니다.

생성된 OAuth 클라이언트의 ID와 Secret Key를 확인할 수 있습니다.

Google Cloud SDK 설치

https://cloud.google.com/sdk/?hl=ko

사이트로 이동합니다.

OS에 맞게 INSTALL FOR MAC OS X 파란색 버튼을 클릭하여 설치를 진행합니다.

$ mkdir GoogleCloudSDK

$ cd GoogleCloudSDK

$ wget https://dl.google.com/dl/cloudsdk/channels/rapid/downloads/google-cloud-sdk-165.0.0-darwin-x86_64.tar.gz

$ tar -xzvf google-cloud-sdk-165.0.0-darwin-x86_64.tar.gz

$ sudo ./google-cloud-sdk/install.sh

Y를 입력합니다.

Y를 입력합니다.

Enter를 입력합니다.

$ source ~/.bash_profile

$ sudo gcloud init

Y 를 입력하여 로그인을 진행합니다.

구글 로그인 사이트로 이동합니다. 로그인을 진행합니다.

'허용' 파란색 버튼을 클릭합니다.

허용 버튼을 클릭 후에 다음의 사이트로 이동합니다.

인증이 완료되었습니다.

터미널로 이동하면 프로젝트 ID가 보입니다.

인덱스 숫자를 입력합니다. 최근에 만든 prime-sign-175907인 1번을 입력합니다.

y를 입력합니다.

Google Cloud Account 생성

https://cloud.google.com/iam/docs/creating-managing-service-accounts

kimjeongchul 이라는 Account 계정을 생성합니다.

$ sudo gcloud iam service-accounts create kimjeongchul --display-name "my service account"

$ sudo gcloud iam service-accounts list

위의 이메일 주소를 복사합니다.

Google Cloud Service Account Key 생성

https://cloud.google.com/iam/docs/creating-managing-service-account-keys

$ sudo gcloud iam service-accounts keys create ~/kimjeongchul_gcloud_service_accounts_key.json --iam-account kimjeongchul@프로젝트명.iam.gserviceaccount.com

keyfile.json

sync-request.json 파일을 만듭니다.

$ vi sync-request.json

{

"config": {

"encoding":"FLAC",

"sampleRateHertz": 16000,

"languageCode": "en-US"

},

"audio": {

"uri":"gs://cloud-samples-tests/speech/brooklyn.flac"

}

}

$ sudo gcloud auth application-default login

이동되는 Google Login에서 로그인을 하고 '파란색' 허용 버튼을 클릭합니다.

이후에 Credentials saved to file이 경로에 저장됩니다. 경로를 복사하여 export 합니다.

$ export GOOGLE_APPLICATION_CREDENTIALS=/Users/kimjungchul/.config/gcloud/application_default_credentials.json

Google Cloud Speech API를 python이나 node js에서 사용하기 위해서는 위의 application_default_credentials.json이 필요합니다.

$ sudo gcloud auth application-default print-access-token

다음과 같이 access-token이 발급됩니다.

다음의 명령어에서 access_token에 들어갈 부분에 위의 액세스 토큰키를 집어넣고 다음의 명령어를 입력합니다.

$ curl -s -H "Content-Type: application/json" -H "Authorization: Bearer access_token" https://speech.googleapis.com/v1/speech:recognize -d @sync-request.json

portaudio19 install

Linux Ubuntu

$ apt-get install portaudio19-dev

Mac OS X

http://portaudio.com/docs/v19-doxydocs/compile_mac_coreaudio.html

$ ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)" < /dev/null 2> /dev/null

$ brew install portaudio

Google Cloud Speech Python

자 이제 실제로 직접 python 코드로 짜여진 음성인식 API를 호출해봅시다.

$ git clone https://github.com/GoogleCloudPlatform/python-docs-samples/

$ cd python-docs-samples/speech/cloud-client

$ virtualenv speech

$ source speech/bin/activate

$ pip -install -r requirements.txt

$ pip install pyaudio

$ python transcribe.py resources/audio.raw

이번에 스트리밍으로 실시간 마이크로 들어오는 음성을 인식해봅니다.

$ python transcribe_streaming_mic.py

$ vi transcribe_streaming_mic.py

main()함수에서 language_code 를 'en-US'에서 'ko-KR'로 변경하면 한국어로 작동됩니다.

$ python transcribe_streaming_mic.py

Google Cloud Speech Node js

https://www.npmjs.com/package/node-record-lpcm16#dependencies

Linux

$ sudo apt-get install sox libsox-fmt-all

Max OS X

$ brew install sox

GitHub

$ git clone https://github.com/GoogleCloudPlatform/nodejs-docs-samples

$ cd nodejs-docs-samples/speech

시스템 전체 node_module을 설치합니다.

$ npm install -g

이 프로젝트를 위해서도 npm install

$ npm install

$ vi ~/.bash_profile

마지막줄에 export GOOGLE_PROJECT=project_id를 입력합니다.

project_id는 프로젝트 정보 섹션 '프로젝트 ID'에서 확인할 수 있습니다.

https://console.cloud.google.com/

$ node quickstart.js

$ node recognize.js

$ node recognize.js listen

$ vi recognize.js

맨 밑으로 내려갑니다.

languageCode에서 default에 'ko-KR' 로 수정합니다.

$ node recognize.js listen

from http://jeongchul.tistory.com/544 by ccl(A)

댓글

이 블로그의 인기 게시물

카카오 오픈빌더와 외부 API 연동(feat.Nodejs)

카카오 오픈빌더와 외부 API 연동(feat.Nodejs) 이전에 플러스 친구와 외부 API 연동에 관한 글을 작성한 적 있습니다. 하지만 지난 2년동안 플러스 친구에 많은 변화가 생겼는데요. 카카오 플러스 친구의 명칭이 카카오 채널로 바뀌고, 챗봇 세팅 방식이 기존 [카카오 플러스 친구 - 외부 API 연동] 구조에서 오픈빌더가 추가되어 [카카오 채널(구 플러스 친구) - 카카오 i 오픈빌더 - 외부 API 연동] 구조로 바뀌었습니다. 이번 글에서는 오픈빌더의 챗봇 시나리오 관리 기능을 간단히 소개하고 외부 API를 연동하는 예제를 다뤄보겠습니다. (연동파트는 5번 항목부터 보시면 됩니다.) 1. 블록 블록은 오픈빌더에서 질의/응답을 관리하는 최소 단위로, 사용자의 발화와 챗봇의 대답을 입력할 수 있습니다. 예를들어 인사라는 블록을 만들고 인사에 해당하는 사용자 발화 패턴들을 입력해두면, 실제 채널 톡방에서 그에 해당하는 발화가 들어왔을때 입력해둔 응답이 나오는 형식입니다. 예전에는 패턴과 발화 키워드가 1:1 매칭, 즉 입력해둔 패턴과 사용자 발화의 string이 정확히 일치할때만 블록이 실행됐었는데, 발화 패턴을 20개 이상 등록하면 머신러닝 기능을 이용할 수 있도록 기능이 생겼습니다. 아마 유사도 분석 개념이 기본으로 들어가있을 것이기 때문에 블록의 주제와 벗어나는 너무 뜬금없는 발화패턴들을 많이 넣지 않도록 하는걸 권장하겠습니다. 2. 시나리오 시나리오는 '블록'들을 묶어서 관리할 수 있는 단위로, 일종의 폴더 구조라고 생각하면 쉽습니다. 오픈빌더에서 좌측 상단에 파란 버튼을 클릭하여 시나리오를 생성할 수 있습니다. 하나의 시나리오에서 모든 블록을 관리하면 챗봇 도메인이 커질수록 관리가 어려워지니 아래 같은식으로 시나리오를 사용하여 블록을 구조화하면 운영 측면에서 수월해집니다. 3. 컨텍스트 컨텍스트는 맥락이라는 뜻 입니다. 오픈빌더에 존재하는 컨텍스트는 자연어 분석을 통해서 맥...

20.03.24 ShareBook TIL

20.03.24 ShareBook TIL Project/TIL 20.03.24 ShareBook TIL 중간 배포를 위해 EC2, RDS를 다시 설정하였다. EC2에 git에서 clone을 하고 서버를 작동시켜보니 ts로 돌려서 그런지 작동하지 않고 대기 상태로 있다가 timeout같은 시간 초과 에러가 났다. 그리고 갑자기 EC2 자체가 느려져서 nodejs를 삭제하고 다시 nvm으로 높은 버전의 node를 설치하였다. 그리고 나서 혹시 js로 돌리면 될까 해서 tsc로 js로 변환한뒤 돌려보니 RDS와 연결이 되지 않는 에러가 생겼다. workbench로 RDS를 연결했을 때는 정상적으로 작동해서 EC2에서 잘 못 설정한게 있다고 생각했다. 그래서 local에서 한번 config.json을 수정하고 연결하여도 똑같은 에러가 발생했다. 그럼 보안 설정에서 문제인가 싶어서 EC2, RDS 보안 그룹에서 설정을 막 만져보다 RDS에서 Custom TCP에 처음 RDS에서 설정한 포트를 넣어주었더니 연결되었다. config.json내용을 EC2에도 똑같이 적용시켜보려고 json파일을 vim으로 작성해서 넣어 주었지만 여전히 같은 에러를 반복하였다. 그럼 json 파일을 못 읽어내는게 아닌가 싶어서 그냥 module에 index.js에서 sequelize를 생성하는 부분에 직접 넣어 주었더니 마침내 연결이 되었다. 해결하고 난 뒤 생각의 흐름을 적어보니 매우 짧지만 정작 오늘 아침 10시 반부터 시작해서 저녁 10시 반까지 12시간을 고민하고나서야 해결되었다. from http://three-five.tistory.com/46 by ccl(A) rewrite - 2020-03-25 00:54:05

AWS instance로 Nodejs 구현하기

AWS instance로 Nodejs 구현하기 서버와 데이터베이스 관리 차원에서 효율적으로 관리하기 위해선 로컬보다는 서버를 호스팅해서 하는 것이 좋다. 우리는 Nodejs를 구동하기 위해 AWS에서 인스턴스를 할당받을 계획이다. 인스턴스의 pem키를 발급받아 nodejs와 npm까지는 설치를 완료한 상태이다. $ sudo npm install -g express 다음의 명령어를 입력하면 글로벌 옵션으로 어느 path에서든 express를 사용할 수 있게 설치한다. 다음과 같이 실행이 된다면 성공이다. 이후 Express generator를 설치한다. $ sudo npm install -g express-generator@4 버전은 4.x이며 이 역시 글로벌 옵션으로 설치해 준다. 이제 Node monitoring을 위해 nodemon을 설치해 준다. $ sudo npm install -g nodemon 모든 설치가 끝났다. 이제 nodejs를 실행시킬 프로젝트용 directory를 만든다. 이렇게 만들어 주고 express를 실행시키면 된다. $ express -e 다음과 같은 결과가 나오면 된다. 이제 node package를 설치하는 명령어를 입력하자. $ sudo npm install 이제 vi를 통해 포트번호를 정의해보자. app.set의 마지막에 한줄을 추가하면 된다. app.set('port', process.env.PORT || 9000); 이로써 우리는 9000번 포트를 사용하게 되었다. 또한 마지막줄에 서버를 생성하기 위한 코드를 작성하자. module.exports = app; var server = app.listen(app.get('port'), function() { console.log('Express server listening on port ' + server.address().port); }); 이...