つくりてのざれごと

投稿

ラベル（自動翻訳）が付いた投稿を表示しています

【Pythonで音声ファイルの文字起こし】Jupyterlabで、自動翻訳まで実行させる方法

投稿日 2022/02/07

はじめに会議などで録音した音声ファイルをPythonで自動的に文字起こしできないものか、と誰かが耳元でつぶやいたので調べてみたところ、既に先達がいて見事なコードを公開されていたのでそれを有り難く利用させてもらいつつ、ついでに英語翻訳も自動でさせてしまおう、ということでそのコードを公開してみる。 DockerにてPythonを動かす環境を構築するので、そのDocker ImageとContainerを作成するDockerfileとDocker Composeも公開する。またPythonの記述はJupyterlabで行うが、その際参照元のPythonコードの1行だけ変更する必要があるので、それについても言及する。ディレクトリ desktop └python_transcriptionフォルダ　　　　　├Docker Composeファイル　　　　　├Dockerfile 　　　　　└workフォルダ └ipynbファイル（jupyterlabで作成・編集） └waveファイル（文字起こしする音声ファイル）　（└outputフォルダ（コードを走らせると自動生成される））（開始前のディレクトリ画像）（作成後のディレクトリ画像）拝借したコードの公開元公開元は、以下のサイト。 Pythonで音声ファイルを文字起こしする - Qiita 会議議事録作成など、音声ファイルをPythonとGoogle Speech recognitionを使って、文字起こしにチャレンジします。 Google Speech recognitionは無料で使えるのは1～3分程... qiita.com このサイトの「プログラムソース」内「音声文字変換3.py」を元に、Jupyterlab用に一部コードを修正し、かつ英語翻訳用のライブラリとコードなどを追加していった。各コードの完成版 Dockerfile完成版 FROM ubuntu:latest ENV DEBIAN_FRONTEND=noninteractive RUN apt-get update && apt-get install -y \ pyt...