From 0e8e3e7ba33ab4c085c70192034611d131502f9e Mon Sep 17 00:00:00 2001 From: Miwa <63481257+ensan-hcl@users.noreply.github.com> Date: Tue, 11 Feb 2025 23:06:14 +0900 Subject: [PATCH] docs: update zenzai.md (#155) * Update zenzai.md * add recent knowledges --- Docs/zenzai.md | 8 +++----- 1 file changed, 3 insertions(+), 5 deletions(-) diff --git a/Docs/zenzai.md b/Docs/zenzai.md index a414d6a..3923bc0 100644 --- a/Docs/zenzai.md +++ b/Docs/zenzai.md @@ -14,8 +14,8 @@ let options = ConvertRequestOptions.withDefaultDictionary( ) ``` -* `weight`には`gguf`形式の重みファイルを指定します。重みファイルは[Hugging Face](https://huggingface.co/Miwa-Keita/zenz-v2-gguf)からダウンロードできます。 -* `inferenceLimit`には推論回数の上限を指定します。通常`1`で十分ですが、低速でも高精度な変換を得たい場合は`10`程度の値にすることもできます。 +* `weight`には`gguf`形式の重みファイルを指定します。重みファイルは[Hugging Face](https://huggingface.co/Miwa-Keita/zenz-v3-small-gguf)からダウンロードできます。 +* `inferenceLimit`には推論回数の上限を指定します。通常`1`で十分ですが、低速でも高精度な変換を得たい場合は`5`程度の値にすることもできます。 ## 動作環境 * M1以上のスペックのあるmacOS環境が望ましいです。GPUを利用します。 @@ -25,10 +25,8 @@ let options = ConvertRequestOptions.withDefaultDictionary( ## 仕組み [Zennのブログ](https://zenn.dev/azookey/articles/ea15bacf81521e)をお読みいただくのが最もわかりやすい解説です。 -## 制約 -現状、Zenzaiを用いた場合ユーザ辞書が使えません。また、予測変換にはニューラル言語モデルは用いられていません。 - ## 用語 * Zenzai: ニューラルかな漢字変換システム * zenz-v1: Zenzaiで用いることのできるかな漢字変換モデル「zenz」の第1世代。`\uEE00\uEE01`というフォーマットでかな漢字変換タスクを行う機能に特化。 * zenz-v2: Zenzaiで用いることのできるかな漢字変換モデル「zenz」の第2世代。第1世代の機能に加えて`\uEE00\uEE02\uEE01`というフォーマットで、左文脈を読み込む機能を追加。 +* zenz-v3: Zenzaiで用いることのできるかな漢字変換モデル「zenz」の第3世代。第2世代と異なり、`\uEE02\uEE00\uEE01`のようにコンテキストを前置する方式を推奨。また、`\uEE03`に続けて入力されたプロフィール情報を考慮する動作をネイティブに学習済み。このほか、実験的に`\uEE04`+トピック、`\uEE05`+スタイル、`\uEE06`+設定も考慮できるようになっています。