convert : fix TypeError on GPT-2 vocab.json (#5288)

2025-06-27 12:05:03 +00:00 · 2024-02-07 13:28:00 +09:00
parent 213d1439fa
commit f68664ac24
1 changed files with 2 additions and 2 deletions
--- a/convert.py
+++ b/convert.py
@ -334,9 +334,9 @@ class Params:
 class BpeVocab:
    def __init__(self, fname_tokenizer: Path, fname_added_tokens: Path | None) -> None:
        self.bpe_tokenizer = json.loads(open(str(fname_tokenizer), encoding="utf-8").read())
-        try:
+        if isinstance(self.bpe_tokenizer.get('model'), dict):
            self.vocab = self.bpe_tokenizer["model"]["vocab"]
-        except KeyError:
+        else:
            self.vocab = self.bpe_tokenizer
        added_tokens: dict[str, int]
        if fname_added_tokens is not None: