辭典
Gukhanmun은 漢字의 한글 讀音을 찾기 爲하여 辭典을 使用합니다. 基本的으로 內藏된 《標準國語大辭典》과 함께 配布됩니다.
內藏 《標準國語大辭典》
內藏 辭典은 自動으로 불러와집니다. 大部分의 韓國語 텍스트에는 追加 플래그가 必要하지 않습니다.
이를 끄려면, 例를 들어 使用者 定義 辭典에 全的으로 依存하고 싶을 때는
--no-stdict를 넘깁니다:
使用者 定義 辭典
-d(또는 --dictionary)로 하나 以上의 使用者 定義 辭典을 提供합니다. 이
플래그는 反復할 수 있습니다:
Gukhanmun은 두 가지 바이너리 辭典 形式을 支援합니다:
辭典은 命令줄에 나타난 順序대로 試圖되며, 內藏 辭典이 마지막으로 參照됩니다. 처음 一致한 것이 採擇됩니다.
使用者 定義 辭典 構築
.gukfst와 .gukcdb 파일은 컴파일된 産出物이며, 손으로 編輯하는 것이 아닙니다.
項目은 純粹 텍스트 表로 作成하여 gukhanmun-mkdict로 컴파일합니다.
gukhanmun-mkdict 빌더는 mise를 通한 設置이든
미리 빌드된 아카이브 내려받기든
gukhanmun과 함께 設置됩니다. 대신 crates.io에서 빌드했다면, 빌더도 같은
方式으로 設置합니다:
項目을 hanja 키 列과 hangul 讀音 列을 가진 탭 區分 파일로 作成합니다:
두 個의 選擇的 列이 렌더러가 各 項目을 어떻게 다룰지를 制御합니다:
require_hanja를 true로 設定하면 (區別이 必要한 同音異義語를 爲하여) 出處
漢字를 보이게 維持하고, require_hangul을 true로 設定하면 原 表記 렌더링
모드에서 한글 倂記를 強制합니다.
表를 FST 辭典(基本 形式)으로 컴파일합니다:
대신 .gukcdb 파일을 만들려면 --format cdb를 넘깁니다. 여러 入力 파일을 줄
수 있으며, 順序대로 倂合됩니다; --merge는 重複 키를 어떻게 解決할지(error,
first-wins, last-wins)를 選擇합니다. 出力을 다시 열어 모든 項目이
往復(round-trip)됨을 確認하려면 --validate를, 出處나 라이선스 같은 來歷을
심으려면 --metadata KEY=VAL을 더합니다.
그런 다음 結果를 다른 使用者 定義 辭典과 마찬가지로 불러옵니다:
CSV와 JSON Lines 入力도 받아들이며, 몇 가지 더 進步된 옵션이 있습니다. 全體 辭典 파일 形式 明細은 內部 構造 섹션을 參照하십시오.