t2本日公開した

June 25 [Tue], 2013, 15:18

本日公開した、中谷宇吉郎「雪雑記」、「「霜柱の研究」について」の図書カードのように、新しく作ったページ。加えて、トップページや作品リストのように更新のかかったところは、新しいUTF-8になっている。
なにも変わっていないページは、従来通りのEUC-JPのまま。これから長い時間をかけて、公開サイト全体のUTF-8化が進んで行く。

それで、なにが変わるのか。
これまで、図書カードやリストで外字注記してきたJIS X 0208にない漢字や、特別な書き方を用いてきたローマ数字などが、コードに置き換わる。
例えば、寺田寅彦の「映画雑感」の表題に含まれるローマ数字はこれまで、「1[#「1」はローマ数字、1-13-21]」と書いてきたが、こロンシャン 刺繍 バッグ が「T」になる。
事情があって、中途半端なところでロンシャン バッグ
中止していたJIS X 0208にない文字のコードへの置き換えを、再開する。「大倉※[#「火+華」、第3水準1-87-62]子」は、今日から「大倉Y子」となった。
置き換えると、表示が期待できないごく一部の文字、例えば、井上円了「「失念術講義」」の底本データ中の「※[#「人がしら/二/心」、U+2B779]」といったものと、Unicodeにもない文字だけ、外字注記で残す。ロンシャン トラベルバッグ
ただし、作品ファイルには変更を加えていない。
テキスト版は従来通り、Shift_JISロンシャン 折りたたみ
。XHTML版もShift_JISで、JIS X 0213の文字は画像で埋め込み、それ以外のUnicodeの文字は、外字注記する形のままとしている。

青空文庫をより広く活用してもらうための水路?として、公開中と作業中作品の書誌情報を、CSVで提供してきた。ロンシャン

今回実施した公開サイトの仕様変更は、青空文庫データベースのUTF-8化があって、可能になったものだ。これで今日から、外字注記をほとんどなくしたUTF-8版のCSVを提供できる。データベースを変えたために、従来提供してきたShift_JISのCShttp://www.long-champtop.com/

Vを、そのままの形で提供することができない。従来に近いバージョンは、Shift_JISをマイクロソフトが拡張した、CP932で出す。
ロンシャン プリアージュ

青空文庫ファイルの利用拡大と足並みを揃えて、書誌CSVも広く使われるようになった。そこに残してきた外字注記を、そのまま引きずった処理もみられる。
今回のUTF-8化が、青空文庫外のシステムにも良い影響をもたらすことを期待している。(倫)ロンシャン トート
プロフィール
  • プロフィール画像
  • アイコン画像 ニックネーム:arwt
読者になる
2013年06月
« 前の月  |  次の月 »
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30
最新コメント
ヤプミー!一覧
読者になる
P R
カテゴリアーカイブ
月別アーカイブ
http://yaplog.jp/zrjsyh/index1_0.rdf