266 Commits

Author SHA1 Message Date
Miwa
1052510aec Merge pull request #127 from ensan-hcl/fix/dakuten_candidates
fix: retryの候補として不適切そうな単語を無視する処理を追加
2024-09-14 23:59:31 +09:00
Miwa / Ensan
971faed131 feat: Zenzaiの利用時にtypo correctionを無効化 2024-09-14 23:58:35 +09:00
Miwa / Ensan
2df31c67d2 fix: retryの候補として不適切そうな単語を無視する処理を追加 2024-09-14 23:36:14 +09:00
Miwa / Ensan
ca8da67f73 fix: プロフィール付き変換で半角コロンを使うように変更、トークナイザの苦手な文字を削除 2024-09-14 23:14:02 +09:00
fkunn1326
58921b244f change git repo 2024-09-14 18:04:48 +09:00
fkunn1326
3215fb7470 Add zenzai cuda support 2024-09-14 08:22:39 +09:00
Miwa
31ce9911ac Merge pull request #122 from fkunn1326/fix-zenzai-on-windows
small fix for zenzai on windows
2024-08-23 22:08:45 +09:00
fkunn1326
875e727030 small fix for zenzai on windows 2024-08-23 21:12:51 +09:00
Miwa / Ensan
a1bfab1542 fix: 考慮漏れの条件を微調整 2024-08-23 00:19:09 +09:00
Miwa / Ensan
31d040e0e8 chore: 使われていないとのコメントは誤り 2024-08-23 00:14:02 +09:00
Miwa / Ensan
af3e2dd2f4 Revert "chore: 使用されていないAPIを削除"
This reverts commit bccb5e48e4.
2024-08-23 00:13:07 +09:00
Miwa / Ensan
87f207eb93 feat: add c+x commands 2024-08-23 00:07:33 +09:00
Miwa / Ensan
f9b66f3eb2 feat: add xn→ん 2024-08-23 00:05:51 +09:00
Miwa / Ensan
bccb5e48e4 chore: 使用されていないAPIを削除 2024-08-23 00:05:39 +09:00
Miwa / Ensan
a3d836d317 fix: ((のような入力でっが入る問題を修正 2024-08-23 00:05:07 +09:00
Miwa / Ensan
4f7bf71908 fix: zenzaiのエラーを修正 2024-08-11 00:52:42 +09:00
Miwa / Ensan
472fe19d41 fix: 既に見た候補の除外を防止 2024-08-10 23:31:39 +09:00
Miwa / Ensan
73d71a02a8 fix: firstClauseResultsとして得られる結果が長さではなくvalueでソートされる挙動を変更 2024-08-10 23:21:50 +09:00
Miwa / Ensan
20fe93c21d perf: avoid useless calculation 2024-08-07 23:38:59 +09:00
Miwa / Ensan
9d31eeee66 chore: swiftlint 2024-08-07 23:10:51 +09:00
Miwa / Ensan
068585c2a5 feat: make the behavior option 2024-08-07 23:09:37 +09:00
Miwa / Ensan
1971f6382b feat: enable rich n-best calculation 2024-08-07 01:23:03 +09:00
Miwa / Ensan
da594057c0 feat: 制約付き変換において計算から除外する候補を減らした 2024-08-04 15:57:48 +09:00
fkunn1326
18aab0e6f8 dicdataのところを修正
consume外すだけでも普通に通った
swiftわからない
2024-08-04 10:06:29 +09:00
fkunn1326
5aa0f52674 Merge branch 'ensan-hcl:develop' into develop 2024-08-04 06:22:54 +09:00
ensan-hcl
445361d6dc feat: add next character prediction API and add it to session cli 2024-08-01 15:57:56 +09:00
Miwa / Ensan
3770633c44 feat: zenz-v2の文脈による条件づけ機能を活かしたAPIを追加 2024-07-31 00:46:39 +09:00
Miwa / Ensan
62f8740271 feat: session運用中に伸ばし棒と句読点の入力が面倒だった問題を修正 2024-07-04 23:17:24 +09:00
Miwa / Ensan
854fb4b1cf fix: 学習の優先度の調整を実装し、実装のミスを修正 2024-07-04 23:17:00 +09:00
Miwa / Ensan
c81f02d6a3 fix: use UTF-8 constraint instead of String 2024-07-04 22:15:25 +09:00
Miwa / Ensan
a50464304c feat: 実装を改善し、単語の途中に非argmaxな文字が出現した場合の処理を安定化 2024-07-04 22:00:35 +09:00
Miwa / Ensan
33339216c4 fix: zenz-v1の出力を学習の適用次に考慮するよう変更 2024-07-03 01:21:59 +09:00
Miwa / Ensan
ca74aaae86 fix: 逐次変換時に学習した辞書エントリは素通しするように変更 2024-06-27 22:50:44 +09:00
Miwa / Ensan
a58397b5a6 fix: add save memory trigger 2024-06-27 21:49:06 +09:00
fkunn1326
846ca0aef9 Merge branch 'develop' of https://github.com/ensan-hcl/AzooKeyKanaKanjiConverter into develop 2024-06-27 07:01:51 +09:00
fkunn1326
569d8adc10 for windows 2024-06-27 07:01:46 +09:00
Miwa / Ensan
1b5cc8b68e fix: minor fixes 2024-06-27 01:35:29 +09:00
Miwa / Ensan
493943d379 fix: support isLearned metadata in LearningManager 2024-06-27 00:41:12 +09:00
Miwa
f58f1603d4 feat: Zenzaiで学習機能を有効化する (#108)
* feat: add metadata for DicdataElement

* feat: ignore learned word in zenz evaluation

* feat: improve session command to support temporal memory
2024-06-27 00:32:44 +09:00
Miwa
fbf09a76eb feat: エスケープされた辞書名をサポート(v2.3.b2) (#106)
* feat: support v2.3.b2 dictionary (https://github.com/ensan-hcl/azooKey_dictionary_storage/pull/3)

* update to v2.3.b2
2024-06-23 17:53:13 +09:00
Miwa
c2e88ae720 [Fix] 漢数字周りのエラーを修正 (#104)
* fix: 漢数字変換が正しくない問題を修正

* test: add check for long number inptu
2024-06-20 23:55:50 +09:00
Miwa
c8ca5b54c0 [Fix] 制約の適用を調整した (#96)
* zenz-v1側は制約をコードポイントレベルで喋るので、grapheme clusterに非依存の処理に書き換えた

* EOSを考慮するように変更
2024-05-19 19:35:28 +09:00
Miwa
dfef9631a9 不必要に指定していたlowerを削除 (#95) 2024-05-19 17:43:20 +09:00
Miwa
e3d29f045b Fix Zenz.swift (#94) 2024-05-16 00:02:38 +09:00
Miwa
55ffe3c708 [Experimental] Zenzai (#92)
* experimental rinna integration

* Update impl

* update

* Bump swift-actions/setup-swift from 1 to 2

Bumps [swift-actions/setup-swift](https://github.com/swift-actions/setup-swift) from 1 to 2.
- [Release notes](https://github.com/swift-actions/setup-swift/releases)
- [Commits](https://github.com/swift-actions/setup-swift/compare/v1...v2)

---
updated-dependencies:
- dependency-name: swift-actions/setup-swift
  dependency-type: direct:production
  update-type: version-update:semver-major
...

Signed-off-by: dependabot[bot] <support@github.com>

* change test

* change impl

* take gpt2 weight as option

* don't use async

* support status check

* enhance error

* avoid percent encode

* update

* GPT-2 based kana-kanji conversion is now perfectly workinggit statusgit status

* fix a bug

* Rename gpt2/llama -> zenz

* cleanup

* internal apiを綺麗にした

* cleanup experimental commands

* update

* partially support incremental input using cache

* fix names

* fix bug

* support roman2kana

* cleanup

* fix minor bugs

* improve logic

* fix minor bug

* fix minor bug

* fix minor bug

* optimize

* optimize performance

* Optimize cache hit

* cli: add anco session command

* fix cache hit bugs

* improve session commands

* maybe this will work better for incremental input environment

* speed up zenzai by using n_best alternatives

* update zenz context

* adding no_typo api

* add inference limit

* fix bug

* reset install_cli

* make package buildable -- but llama.cpp features just do not work at this point because metal is not preprocessed

* add proper availability checks

* change macOS minimum version

* fix several problems

* code cleanup

* enable ubuntu build

* fix build error

* fix ubuntu build

* fix borrowing

* update install_cli.sh

---------

Signed-off-by: dependabot[bot] <support@github.com>
Co-authored-by: dependabot[bot] <49699333+dependabot[bot]@users.noreply.github.com>
2024-05-15 01:36:45 +09:00
Miwa / Ensan
c4aa3eee76 [cli] 複数の不具合を修正 (#91)
* stabilize json outpug

* enable entropy calculation for smaller values

* chmod +x
2024-05-09 00:47:07 +09:00
Miwa / Ensan
5ed0ddb45e cli: add evaluate command (#90) 2024-05-04 16:54:44 +09:00
Miwa / Ensan
861ac7a026 feat: MetadataのAPIをより柔軟にした (#89) 2024-05-04 11:56:09 +09:00
Miwa / Ensan
c211bc36cd [cli] 完全一致変換のみを出力するモードを追加 (#88)
* cli: add option to report score

* cli: 完全一致変換をサポート
2024-05-04 11:39:20 +09:00
Miwa / Ensan
3cf83bc05b cli: add option to report score (#87) 2024-05-03 21:56:01 +09:00