昨日、紹介したMacパソコンのエディターJedit Xを本日、いろいろと試してみました。機能豊富の中でも、とりわけ重宝しているのが複数一括置換です。今回は青空文庫のサイトからダウンロードしたテキストで第3、第4水準の漢字が面区点コードで表記されたものをユニコードに変換するのに使ってみました。第3、第4水準の漢字はその文字数が約3,700と数多くあります。この数の分だけ、面区点とユニコードが1対1対応していて、テキスト文に出てきた面区点を検索して、合致したものをユニコードに変換させる必要があります。画像はこの置換を一括処理する操作画面で、第4水準の漢字、2436文字を全検索して、5カ所がヒットして置換されたことを示しています。この検索置換にはおよそ1分ほどかかりましたが、そのパフォーマンスには圧倒されました。この後、InDesignでテキスト文を読み取り、ユニコード入力された文字コードが正しい漢字に表記されたことを確認しました。第3水準の漢字も同じように一括処理するのですが、この検索文字列と置換文字列はマニュアルで本日、作りました。例えば、第4水準の漢字では、まずネット公開しているサイトから全文字のリストをデッドコピーをしてExcelで整理し、できあがった対応表をJeditの検索ページでファイル読み込みすることで、かなり効率良く処理ができました。青空文庫のサイトから本日入手した小説を文庫本にした成果については後日、当ブログにて...
Monthly photo – 2024.8
アーカイブ
カテゴリー
-
最近の投稿
最近のコメント
- やっと完成、白馬岩岳スライドショー に 安曇野の風 より
- やっと完成、白馬岩岳スライドショー に 小宮山 務 より
- SSD、突然クラッシュ に 小宮山務 より
- 夕焼け に 小宮山務 より
- 麦畑がいつの間に に 安曇野の風 より
- 麦畑がいつの間に に 小宮山 務 より
- 安曇野・黒沢川沿いの桜 に 小宮山 務 より
- 安曇野「早春賦」の桜 に 安曇野の風 より
- 安曇野「早春賦」の桜 に 小宮山 務 より
- 風邪、長引く に 安曇野の風 より
メタ情報