From 4853d9bfb7b96f6b3b7d095402879778eb27e162 Mon Sep 17 00:00:00 2001
From: j <j@mailb.org>
Date: Fri, 24 Jan 2025 11:50:41 +0530
Subject: [PATCH 1/3] update depends

---
 README.md | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/README.md b/README.md
index 2c7eb6a..932199e 100644
--- a/README.md
+++ b/README.md
@@ -14,8 +14,8 @@ add "transcribe" to LOCAL_APPS in local_setttings.py
     apt install portaudio19-dev
     python3 -m venv venv /opt/whisper-timestamped/
     /opt/whisper-timestamped/bin/pip install \
-     torch==1.13.1+cpu \
-     torchaudio==0.13.1+cpu \
+     torch==2.3.1+cpu \
+     torchaudio==2.3.1+cpu \
      -f https://download.pytorch.org/whl/torch_stable.html
     /opt/whisper-timestamped/bin/pip install whisper-timestamped transformers auditok
 

From 7f11a62243852407fe5f401ae58ff18478a37969 Mon Sep 17 00:00:00 2001
From: j <j@mailb.org>
Date: Fri, 24 Jan 2025 11:50:49 +0530
Subject: [PATCH 2/3] select model

---
 run_whisper.py | 10 ++++++----
 1 file changed, 6 insertions(+), 4 deletions(-)

diff --git a/run_whisper.py b/run_whisper.py
index e56b988..471347e 100644
--- a/run_whisper.py
+++ b/run_whisper.py
@@ -6,8 +6,9 @@ import sys
 import whisper_timestamped as whisper
 
 
-def transcribe(path, language=None, translate=None):
-    model = whisper.load_model("large-v3-turbo")
+def transcribe(path, language=None, translate=None, model="small"):
+    #model = whisper.load_model("large-v3-turbo")
+    model = whisper.load_model(model)
     audio = whisper.load_audio(path)
     if translate:
         task = "translate"
@@ -33,10 +34,11 @@ if __name__ == "__main__":
     usage = "usage: %(prog)s [options] path output"
     parser = ArgumentParser(usage=usage, prog="run_whisper")
     parser.add_argument("-l", "--language", dest="language", default=None)
-    parser.add_argument("-t", "--translate", dest="translate", default=None)
+    parser.add_argument("-m", "--model", dest="model", default="small")
+    parser.add_argument("-t", "--translate", dest="translate", action='store_true', default=False)
     parser.add_argument("path", metavar="path", type=str, help="media input")
     parser.add_argument("output", metavar="output", type=str, help="json output")
     opts = parser.parse_args()
-    result = transcribe(opts.path, opts.language, opts.translate)
+    result = transcribe(opts.path, opts.language, opts.translate, opts.model)
     with open(opts.output, "w") as fd:
         json.dump(result, fd, indent=2, ensure_ascii=False)

From 98c680e89cbe46029ef15f40aaffd252649947ba Mon Sep 17 00:00:00 2001
From: j <j@mailb.org>
Date: Fri, 24 Jan 2025 11:51:00 +0530
Subject: [PATCH 3/3] re-enable language/translate

---
 transcribe.py | 3 +--
 1 file changed, 1 insertion(+), 2 deletions(-)

diff --git a/transcribe.py b/transcribe.py
index 8d31085..b750f8c 100644
--- a/transcribe.py
+++ b/transcribe.py
@@ -1,3 +1,4 @@
+import json
 import logging
 import os
 import shutil
@@ -93,12 +94,10 @@ def prepare_joint_annotations(result, target_length=200):
 
 def extract_subtitles(item, user, layer, translate, gpu=False, join_sentences=False):
     language = None
-    """
     if "language" not in item.data:
         language = None
     else:
         language = ox.iso.langTo2Code(item.data["language"][0])
-    """
     if not item.streams():
         logger.error("skip item without media %s: %s", item.public_id)
         return False