投稿

ラベル(自動翻訳)が付いた投稿を表示しています

【Pythonで音声ファイルの文字起こし】Jupyterlabで、自動翻訳まで実行させる方法

イメージ
はじめに 会議などで録音した 音声ファイルをPythonで自動的に文字起こし できないものか、と誰かが耳元でつぶやいたので調べてみたところ、既に先達がいて見事なコードを公開されていたのでそれを有り難く利用させてもらいつつ、ついでに英語翻訳も自動でさせてしまおう、ということでそのコードを公開してみる。 DockerにてPythonを動かす環境を構築するので、そのDocker ImageとContainerを作成するDockerfileとDocker Composeも公開する。 またPythonの記述はJupyterlabで行うが、その際参照元のPythonコードの1行だけ変更する必要があるので、それについても言及する。 ディレクトリ desktop └python_transcriptionフォルダ      ├Docker Composeファイル      ├Dockerfile      └workフォルダ └ipynbファイル(jupyterlabで作成・編集) └waveファイル(文字起こしする音声ファイル)   (└outputフォルダ(コードを走らせると自動生成される)) (開始前のディレクトリ画像) (作成後のディレクトリ画像) 拝借したコードの公開元 公開元は、以下のサイト。 Pythonで音声ファイルを文字起こしする - Qiita 会議議事録作成など、音声ファイルをPythonとGoogle Speech recognitionを使って、文字起こしにチャレンジします。 Google Speech recognitionは無料で使えるのは1~3分程... qiita.com このサイトの「プログラムソース」内「音声文字変換3.py」を元に、Jupyterlab用に一部コードを修正し、かつ英語翻訳用のライブラリとコードなどを追加していった。 各コードの完成版 Dockerfile完成版 FROM ubuntu:latest ENV DEBIAN_FRONTEND=noninteractive RUN apt-get update && apt-get install -y \ pyt...