ストロンチウムや東京電力の当て字的表記は陰謀や天狗のしたこと、ではなくてOCRのミス

| コメント(0)

【「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」 原子力規制庁、サイトを修正】
【第10回特定原子力施設監視・評価検討会汚染水対策検討ワーキンググループ】
【なにが困る?PDFファイルでのネット情報発信】

↑ 第10回特定原子力施設監視・評価検討会汚染水対策検討ワーキンググループ資料一覧
↑ 第10回特定原子力施設監視・評価検討会汚染水対策検討ワーキンググループ資料一覧


先日から話題に登っていた、カタかなの「ロ」が漢字の「口(くち)」に、漢字の「力(ちから)」が「カ(かたかなの「か」)」になっていたなどの理由から、検索避けの偽装工作で陰謀だ云々という話が広まっていた件について。結構著名な方々までこの説を後押ししていた節があり、少々唖然としたところがあったんだけど、結局これはよくありがちな「スキャナとOCRソフトの認識によるミス」という公式な見解が出て、指摘のあった部分は修正された次第。まあ、この話が出た直後から「それすら陰謀だ、隠ぺいだ」という話題を振りまいている筋があるので、もう何が起きてもそのつもりなんだろうなあ、という感じはする。

今件については話が出た直後に大体の落ちは予想がついていたので、ヤフー個人ニュースでも【シンプルに妄想チェックをする方法、そのキーワードは「天狗(てんぐ)」】という記事を前倒しで展開し、その中でさらに「報告書の文字が似たような別の文字に差し替えられたのは、天狗が検索を避けるために行った」とわざわざ事例を挙げた次第。

東証の適時開示報告や官公庁の各種リリースに目を通す機会がそれなりにあれば、こういう類の話はよく見聞きしている、経験しているはず。また自分でスキャナとOCRソフトを使っていれば、この類のミスはよく起きることも理解しているはず(ミスが見逃されて良いか否かとはまた別の話)。それらの経験則があれば、これは陰謀の類では無く、リソース不足から来るプロセスの簡略化・スピード化による単純なミスの類であることは、容易に想像がつくはずなんだけどねえ。

第一本当に「検索避け」を模索するのなら、もっと巧みにやる。詳しい手口はアレなので説明しないけど。陰謀の類にしてもチャチすぎる。しかもこれ、資料として開示されたのは今年の1月。もう明らかに「騒ぐネタが無くなってきたので、あちこち掘り返して見つけ出して騒ぎたい」という思惑がありありと。

一方、官公庁のリリースにPDF形式が多い、しかもテキスト化されているはずの書類を一度紙にプリントし、それを取り込んでPDF化するという、利便性では明らかに不可解な方法がよく用いられる事由については、以前どこかでその実情を聞いた記憶があるんだけど、どうにも思い出せない。確か前政権下の時期に、以前からの計画やら方針に従ってテキスト化が進めたら、管理か何かの問題が多発して、手間が異様にかかるようになったので、結果として逆行してしまった、テキスト化することで「当時の政権下において」都合の悪い状況が発生した云々ってのを聞いたことがあるんだけど、ログの類が見つからない。聞いた時には納得できる内容だったことは覚えているんだけどなあ。まとめ書きをしておけばよかったか。

「なにが困る?PDFファイルでのネット情報発信」のまとめを読み直して、記憶をたどってみるか......。PDFは汎用性の高さ、発信側の「このスタイルで不特定多数に読ませたい」という意志を通す上では、確かに優れているんだけどね。漫画やウェブ雑誌をPDFで展開するってのも、そのあたりの長所を用いたものだし。

関連記事             

コメントする

            
Powered by Movable Type 4.27-ja
Garbagenews.com

この記事について

このページは、不破雷蔵が2014年6月11日 07:36に書いた記事です。

ひとつ前の記事は「ほほう、山田うどんで紅しょうが尽くしなメニューですとな!?」です。

次の記事は「今度はブリ照り焼き定食...「孤独のグルメ」掲載号のSPA!(2014年6月11日発売号)確保」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

* * * * * * * * * * * * * *


2021年6月

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30