再びテキストマイニング

本のマイニングは小説の方が面白い

先日のエントリー、「自著をテキストマイニングしてみた」では、いちおうマジメなビジネス書でトライしてみました。
でも、KH Coderのチュートリアル(KH Coderチュートリアル & ヒント)にあるように、夏目漱石の「こころ」でやると、ストーリー展開みたいなものが見えてくる。自分も何かないか……ということになり、こちらの本をマイニングしてみることに。

下記の12の昔話っぽいものを題材とし、いちおうビジネスっぽい感じの寓話に仕立て上げております。

マッチ以外のものも売る少女(市場発見とブランド)
白い雪の化粧品(IT広告とビジネスモデル)
スズメのアンケート(マーケティング調査)
キリギリスとアリ(キャリア・マネジメント)
王様のファッション(テスト・マーケティング)
鶴の恩返し・哀愁編(価格戦略と効率化)
鶴の恩返し・風雲編(商い方)
金の斧と銀の斧とチェーンソー(働き方改革)
北風と太陽と雨と(セールス・プロモーション)
ある漁師の告白(コンプライアンス)
太郎フルーツ株式会社・前編(需要開拓)
太郎フルーツ株式会社・後編(営業改革)

文字数は約4万8000字。ちょうどいい感じではないかと。早速やってみました。

共起ネットワークの真骨頂

KH Coderの共起ネットワークは、全語でやるパターンと、章ごとに見るパターンの2つがあります。
全語でやってみると、こんな感じに。ちょっとキモいかも。

「鶴の恩返し」で出てきた「反物」が、最も中心性が高い。でも意味がわかりません。「スズメのアンケート」でスズメにやたらと「チュン」と言わせたために、「チュン」がやたら大きく出ているし。これでは使えない。

でも章ごとに見てみると、こんな感じになります。

これだと、章ごとのキーワードのつながりが見えてくる。「スズメのアンケート」と「白い雪の化粧品」は「テレビ」でつながっている。そうです。そうなんです。
「キリギリスとアリ」と「金の斧と銀の斧とチェーンソー」は「働く」をキーワードとしている。これも当たっておりますな。さすがテキストマイニング!

さらに、「北風と太陽と雨と」「白い雪の化粧品」「鶴の恩返し」は「女」でつながる。その通りです。
そして、プロモーションのことを書いている「王様のファッション」だけ孤立している。たしかにそうです。

やはり、ストーリー性のある文章の方が、全体の構成が見えやすいようです。「青空文庫」にある名作は、やってみる価値があるのでは?

Amazonの電子書籍に自動でできないか

今時の小説家で、まさか手書き原稿という方はいないでしょう。
つまり、今後生まれてくる作品も、出版社がKH Coderでチャチャッとやって、巻頭か巻末に共起ネットワークの図をつければいいだけ。書籍に掲載せずとも、出版社の公式サイトに載せるくらいなら、訳ないことだと思います。ぜひ実現していただきたいものです。

というより、AmazonがKindle本を全作自動でサイト上にアップしたら、ちょっとした革命が起きるのでは。経営から「忖度」やらの感情を一切排除するAmazonなら、やっても全然おかしくありません。いや、ぜひやって欲しいものです。

Google AdSense2

Google AdSense

   

 - 日記 ,