辞書システム
0kqBee の辞書システムは、サーバーごとの単語登録と正規表現パターンによるテキスト変換をサポートしています。
辞書の種類
サーバー辞書
/dict add で登録する、サーバー固有の辞書です。
- 通常エントリ(リテラルマッチ)
- 正規表現エントリ
プリセット辞書
/dict preset で有効化できる、あらかじめ用意された辞書です。
- 複数のプリセットを同時に有効化可能
- サーバー辞書と併用可能
- 各プリセットには名前、説明、作者、ライセンス情報が含まれます
辞書フォーマット(v1)
json
{
"version": 1,
"entries": {
"w": "わら",
"おk": "おっけー",
"thx": "さんきゅー"
},
"regex_entries": {
"ww+": "わらわら"
}
}| フィールド | 説明 |
|---|---|
version | 辞書フォーマットのバージョン |
entries | 通常の辞書エントリ(単語 → 読み方) |
regex_entries | 正規表現の辞書エントリ(パターン → 置換文字列) |
正規表現
/dict add で 正規表現: True を指定すると、正規表現の辞書として登録されます。
- 正規表現エンジンには re2 を使用
- 登録時にパターンの妥当性が検証されます
- 無効なパターンはエラーとなり登録されません
例
| パターン | 読み方 | 効果 |
|---|---|---|
[0-9]+ | すうじ | 数字の連続を「すうじ」と読む |
ww+ | わらわら | 「ww」以上を「わらわら」と読む |
辞書の変換
/dict convert で他のIME・BOTの辞書ファイルから変換できます。
入力対応形式
| 形式 | エンコーディング | 区切り |
|---|---|---|
| 0kqBee v0 / shovel | UTF-16LE | CSV |
| 0kqBee v1 | UTF-8 | JSON |
| VOICEVOX/VOICEROID読み上げBOT | UTF-8 | CSV |
| Microsoft IME | UTF-16LE | TSV (読み→単語) |
| Google 日本語入力 | UTF-8 | TSV (読み→単語) |
| MacOS 辞書 | UTF-8 | CSV (読み→単語) |
| MacOS ユーザー辞書 | バイナリ | plist |
出力対応形式
| 形式 | エンコーディング |
|---|---|
| 0kqBee v0 / shovel | UTF-16LE CSV |
| 0kqBee v1 | UTF-8 JSON |
| VOICEVOX/VOICEROID読み上げBOT | UTF-8 CSV |
WARNING
正規表現エントリ(regex_entries)は 0kqBee v1 形式でのみ保持されます。他形式への変換時には通常の辞書のみが出力されます。