AIくずし字認識アプリを作った源氏物語ファンのタイ人女性「日本の研究者にバカにされてつれぇわ」 [788192358]

AIくずし字認識アプリを作った源氏物語ファンのタイ人女性「日本の研究者にバカにされてつれぇわ」  [788192358]

1 ::2021/10/11(月) 13:00:59.33 ID:YDhvmomo0●.net ?2BP(10000)

2021 10 07 THU

ビデオ会議の背景は『源氏物語絵巻』。気さくで明るい人柄だが、古典のくずし字が読まれない日本の現状には不満をあらわにする。彼女からは古典文学が「好き」という気持ちがあふれ出していた。

タリンさんはタイの首都・バンコク出身。日本の古典文学に魅了され、大学院進学とともに1人で来日した。大学院での専攻は『源氏物語』の古注釈ながら、古典文学の魅力を少しでも多くの人に伝えるために、AI(人工知能)によるくずし字認識に取り組み始めた。

彼女が開発したくずし字認識スマホアプリ「みを(miwo)」はSNS上などで大きな話題になった。スマホやタブレットのカメラでくずし字資料を撮影し、ボタンを押すだけで、AIが1枚あたり数秒でくずし字を現代の文字に変換するアプリだ。精度は江戸時代の版本では約95%におよぶ。

彼女は2021年8月31日にROIS-DS人文学オープンデータ共同利用センター(CODH)、国立情報学研究所(NII)を退職し、9月6日にグーグル合同会社 AI開発部門 Brainチームのリサーチ・サイエンティストとして入社した。

(中略)

「『AIによるくずし字認識は望ましくない』『こんな研究は良くない』という国文学研究者が何人かいました。古典文学を広めようと頑張っているのに、自分が所属する分野の人たちに反対されるのはつらいです」

開発中に何度も沈んだ気持ちになった。それでも、くじけそうな気持ちより古典文学が「好き」という想いと、その魅力があまり伝わっていない日本の現状を変えたいという気持ちのほうが勝った。

「SNS上で高校の教育に古文・漢文は必要ないという意見をよく目にします。だけど、高校のときに古文・漢文が必要ないと言ったら、人生でいつ勉強するんですか。大抵の日本人は大学に入ったら、古文・漢文に触らなくなります。本屋さんには古典文学の本はたくさん売っていますが、古典文学、とくに原文を読もうとする人は少ないのではないでしょうか?」

気さくで笑顔が絶えない彼女の顔がちょっとだけ曇った。日本にはこんなに良い古典がたくさんある。古典を忘れないで。古文・漢文を勉強して。国内外の講演でいつもそう訴えている。古典文学への想いがあふれ出してきた。

画像・全文
https://ledge.ai/tkasasagi-interview/

336 ::2021/10/11(月) 17:56:49.13 ID:jJcWIWCE0.net

>>68
真実なら、一部は「反日種族主義」の本に書いてあるが、チョンはこちらの方をデタラメだと言うくらいだから
自分に都合が悪い真実が古典の漢文で書いてあってもどうせ信じないw

401 ::2021/10/11(月) 20:28:10.80 ID:6FonubZd0.net

>>385
関係ないけど、何年か前にあったテレ朝のドラマで、文書捜査官の女、とかいうのがあって
未解決事件を残された文章や文字を解読して解決する、って話で面白そうだったけど
いざ見てみたらほとんど筆跡鑑定で事件を解決するだけでつまらなかったな

325 ::2021/10/11(月) 17:33:58.46 ID:jJcWIWCE0.net

>>13
戦時中の新聞なんか字画の多い旧漢字だらけだからな

494 ::2021/10/12(火) 08:09:56.69 ID:GHVBjkZu0.net

世の中全てポジショントーク

9 ::2021/10/11(月) 13:05:12.65 ID:9WGasfdc0.net

凄いね

488 ::2021/10/12(火) 07:01:17.52 ID:09lfu2Mm0.net

日本の古典が分かって
AIも組めるとか
天才かよ

381 ::2021/10/11(月) 19:32:59.39 ID:jJcWIWCE0.net

>>360
記事読んだが、そういう意味じゃない。留学生で日本の大学に来たが10年で期限が切れて、卒業すると
企業で働かない限り日本にいられない。しかし、日本の古典の研究と関係ない仕事に就くのは嫌だったから
研究成果が生かせる仕事がないか探して今の仕事に就けた。
本人は、税金の正しい使い方を考えてやったわけじゃない。

322 ::2021/10/11(月) 17:25:56.25 ID:bQkCrrJz0.net

日本人に開発してもらいたかったよね

302 ::2021/10/11(月) 16:37:21.82 ID:uvxeihtS0.net

>>300
その通り。だからこそ、学術上の反対意見として、反対意見を表明している者の名と主張を公開して、広く意見を問うべき。

542 ::2021/10/12(火) 19:04:26.98 ID:Ikpq3GE30.net

>>529
AIが誤認識したら日本語として意味が通じなくなるから普通はわかる。
たまたま意味が通じるように誤認識したらしばらく気づかないかも知れないが、誰かが原文と照合すれば間違いに気が付く。

343 ::2021/10/11(月) 18:12:20.87 ID:vnoIi+UP0.net

>>4
要は貴族がやりまくってたった話しだろ?国関係無いじゃん

470 ::2021/10/12(火) 01:24:30.09 ID:KeVzP+cK0.net

無能ほど情報を独占したがる。

171 ::2021/10/11(月) 13:58:17.15 ID:q+QuMS4/0.net

顔が日本人で草

562 ::2021/10/12(火) 23:32:51.94 ID:8wuHRzhp0.net

>>539
チョン語にも崩し字の古典いっぱいあるけど
なんで知らんのにもの言おうと思ったん?
チョン文字はモンゴル系文字由来だけあって初期の字体は縦線がピシッと通ってすごい綺麗

46 ::2021/10/11(月) 13:12:28.39 ID:hmc12vS20.net

笑い飯の哲夫が般若心経を漢文として一字一句読んでいく本がかなり面白かった

165 ::2021/10/11(月) 13:56:43.91 ID:IiZFJ3bE0.net

翻訳ソフトできても自分で読めなければ意味無いからかな
漢字も使わなくなる

92 ::2021/10/11(月) 13:23:08.79 ID:ZPMDDVUN0.net

>>79
AIにとっちゃ日本語も未知の言語も同じだから、例文の量次第

389 ::2021/10/11(月) 19:51:58.11 ID:34CctvZc0.net

AIに仕事を食われた研究職第1号?

489 ::2021/10/12(火) 07:03:55.73 ID:t6PtbYcJ0.net

こういう年寄りが全てを駄目にしてるんだよな
まさに老害

228 ::2021/10/11(月) 14:53:53.95 ID:W9RkzVJ40.net

だから私はニャウリンガル

149 ::2021/10/11(月) 13:50:16.13 ID:utjBdCKC0.net

インドにも言えよ
サンスクリットって寺の梵字
インドでは途絶えた文字で観光に来たインド人がビビる文字

204 ::2021/10/11(月) 14:14:51.75 ID:6ahXe6i10.net

反対してた奴の名前出せよ

493 ::2021/10/12(火) 07:56:41.13 ID:UrXCb38f0.net

すばらしい
保身しか考えてない老害研究者はガン無視でいいよ

59 ::2021/10/11(月) 13:14:31.17 ID:t6mp78ER0.net

>>7
気持ち悪いなこの豚

251 ::2021/10/11(月) 15:14:29.41 ID:iGbEzMVZ0.net

江戸時代の板本で95%だろ
そんなの読めて当たり前なんだよ商業印刷なんだから
中古の写本とか近世の文書とかが読めるんなら凄いがそうじゃないんだろ

408 ::2021/10/11(月) 20:32:04.56 ID:l9KX9l3x0.net

>>404
な?全く同じ意義のことをひたすら繰り返して本当に朝鮮人以下、穢多非人以下のボンクラだよお前…w

125 ::2021/10/11(月) 13:39:19.94 ID:0xWcRWZm0.net

>>117
俺は全く理解できないわけじゃない
翻訳本なら明確に翻訳者の責任になるけど
完全AI任せだと翻訳間違いがあった場合誰の責任になるのかあやふやだし
そもそも読めない人間は間違いに気づくことができないし

541 ::2021/10/12(火) 19:01:26.77 ID:Ikpq3GE30.net

>>524
明治以降の歴史なんてNHKでしょっちゅう特集してるし、ちょうど大河ドラマ「青天を衝け」でもやってる。

559 ::2021/10/12(火) 22:35:58.80 ID:6GKXilZH0.net

>>140
> 日本の研究者には馬鹿にされたけど
> グーグルに入社出来たのだから勝ち組

日本の研究者の中には否定する人もいたけど
一緒に研究してた人もいるってことだぞ

224 ::2021/10/11(月) 14:51:57.72 ID:4YNKGCfE0.net

ドラえもんのほんやくこんにゃく作ったら通訳からクレームきたみたいな話だろ

378 ::2021/10/11(月) 19:23:53.23 ID:qhf284JD0.net

>15
>「候」とかほとんど点々だからね
「〜でございます、〜でございます、〜でございます…」な訳で、そりゃ点々にもしたくなる
むしろ、そういうことであるなら、「点々は候だ」と考えればいい、それが知恵というもんだろう

93 ::2021/10/11(月) 13:23:15.84 ID:QlQeLdlw0.net

>>84
Googleにも文句言ってそう

2 ::2021/10/11(月) 13:01:23.66 ID:kd4cTEv20.net

2ダ!

346 ::2021/10/11(月) 18:21:11.13 ID:aXqrAxZ+0.net

>>6
ルーン文字とか古代エジプト文字読めるって特別感あるのに誰でも読めるようになると古代語学身につけた希少感無くなるようなもんでは

245 ::2021/10/11(月) 15:09:25.45 ID:J5S3o4CX0.net

>>6
外国語翻訳できる人が翻訳アプリなんか作るな!と言ってるのと変わらんよな

364 ::2021/10/11(月) 18:55:16.53 ID:sZ7maeMk0.net

>>26
慣れ

463 ::2021/10/11(月) 22:49:59.23 ID:OrC+RWw30.net

>「SNS上で高校の教育に古文・漢文は必要ないという意見をよく目にします。だけど、高校のときに古文・漢文が必要ないと言ったら、人生でいつ勉強するんですか。

必要性を説けよ

459 ::2021/10/11(月) 22:31:17.29 ID:BRZR/SLg0.net

>>71
源氏物語絵巻

187 ::2021/10/11(月) 14:06:43.47 ID:kijJkVbQ0.net

エジプトのヒエログリフをgoogleが翻訳実験ってのも有ったな

269 ::2021/10/11(月) 15:28:37.17 ID:YwPKkK+X0.net

>>260
あんた確実にヤバい人じゃん

361 ::2021/10/11(月) 18:45:33.08 ID:kqXCQlpr0.net

国籍透視マンID真っ赤で怒りの擁護で笑ったw

590 ::2021/10/13(水) 13:10:23.17 ID:LsmFqIc80.net

https://itest.5ch.net/hayabusa9/test/read.cgi/news/1624177178

こっちは逆に主張者が盛大にバカにされてるが…
まあ仕方ないかひろゆきだし

572 ::2021/10/13(水) 06:33:37.37 ID:l7eq//gp0.net

江戸期が草書ばかりとは限らないわけだが
暁鐘成『偶言三歳知恵』1825年

英泉『枕文庫』(1822-1832年頃

アルファベットとアラビア数字を使ってないだけ

355 ::2021/10/11(月) 18:37:01.76 ID:/Qimh1Og0.net

現時点で凸版印刷の有料アプリと精度は大して変わらんみたいだし
こっちは無料でグーグルで配られてるのだからフィードバッグを考えると
数年後は相当な差が出来てるだろうな

66 ::2021/10/11(月) 13:16:05.09 ID:80UZbOPY0.net

その学者の名前出せ。見解が聞きたい。

427 ::2021/10/11(月) 20:47:32.33 ID:2xxp2oAw0.net

>>419
くずし文字で、続き文字なんでしょ?
画像を一文字に分割するのがまず
難所では。

前後関係からしか判別できない文字も多数あると思うよ。

462 ::2021/10/11(月) 22:41:37.67 ID:SxRaBvGR0.net


こういうのもAIなら読めるのか

174 ::2021/10/11(月) 13:58:57.35 ID:LAVbMU8K0.net

この手の機械学習はそれが持つ本来の意味をとるものではなく、ようは画像のパターン認識・学習だから、文学を研究するという視点からは無粋と言えば無粋
何でも効率化と時短を進めればいいものではない、という反発が出てくるのも無理はない

一方で、手軽なものがあることで裾野が広がるのも確か

お互いわかっちゃいるんだろうけどね

292 ::2021/10/11(月) 16:17:47.51 ID:JK4AIwHc0.net

>>212
グーグル翻訳した文章を論文にそのまま乗っけていいのかみたいな話じゃね?

69 ::2021/10/11(月) 13:17:09.48 ID:9Y3R4LGy0.net

聖書だって長年ラテン語でしか記述されずに庶民はそれを読み解くことすら許されなかったけど
日本は識字率も高いし、ひらがなカタカナを採用したのもあって慣れれば子どもですら読めてしまう
この文化は誇ってもいい

ニュー速カテゴリの最新記事