https://www.duolingo.com/no-name420

漢字、数字の読み仮名の疑問

no-name420
  • 25
  • 7
  • 2
  • 290

こんにちは:

このディスカッションは こちらで挙げられていた疑問に乗っかって立ち上げたスレッドです。 これを目にしたcontributorの方やDuolingo運営の方や内情に詳しい方にコメントを頂ければいいなと思いながら書いています。 私が確認することが可能な範囲で状況をまとめてみました。

ざっくりいうと:

現状の確認

「何この判定、意味分かんない」という人がこのディスカッションを見ることで、現状のDuolingo(英語コース)の正誤判定が、どういった仕組みになっているのか、現在どういう状況なのかを把握する手助けになれば幸いです。

疑問1.解答で許容される「数字が絡んだ表現の読み仮名、単位」の現状は?
疑問2.これはどうやったら解決に近づくか?

などについて現状と意見をまとめたいと思います。

本題の前に、関連する話題として

「※1. 日英コース改善のための提案 」のディスカッション内で、Duolingo運営のhidekiさんが以下のような説明をされています。

現在はシステム側で漢字とひらがな、カタカナの差異は吸収されるようになっています。 ですので、「私達」が正解の時は「私たち」「わたしたち」「ワタシタチ」はすべて正答になるはずです

以下本文内で説明の便宜上、このDuolingo側の対応を「漢字読み仮名対応」と仮に名前付けします。

Duolingoの正誤判定に対するコンセプトは、下記の2点があると認識しています

  • 手作業対応:利用者の報告レポートを元にした、contributorの方達による手作業によるメンテンナンス。回答パターン作成画面は「※2. 現在完了形の日本語訳が不自然」のディスカッション内でスクリーンキャプチャが公開されていますが、最新の画面とは異なっている可能性は十分にあります。

  • システム対応:Duolingo運営が各出題に横断的に存在する課題をシステム側(プログラム)で解決策を講じる。

それを踏まえると、「漢字読み仮名対応」は2番目のシステム対応と言えるでしょう。

疑問1について:

解答で許容される「数字が絡んだ表現の読み仮名、単位」の現状は?

簡単にいうと「1つ」でも「ひとつ」でも正解になるべきでは?という疑問についてです。 これを先ほど同様、仮に「数字読み仮名対応」と名前付けします。 この対応については「漢字読み仮名対応」とは違い、運営の方が明言している情報源を見つけることができませんでした。
また、「1個」は「1こ」「一こ」「いっこ」のように「漢字読み仮名対応」と「数字読み仮名対応」が混在しているという課題も同時に存在すると予想しています。

先に結論

現状「漢字読み仮名対応」は「数字+単位」が絡まないものは大体対応されていそうです。
「数字+単位」が絡むものは手作業メンテナスに依存していそうなので、結果は一定ではなく揺れがあります。出題毎に正解と判定される表記が異なることが十分にあるということです。

現状の確認作業

以下では1つの問題を実例に挙げて、挙動を確認してみました。
※これは当然、個別の出題に用意された回答パターンによって揺れがあると思いますので、あくまで正答判定の一例として見てください。

英語を日本語に訳す出題。
英文:"You eat an apple."
提示された正答例:
「あなたは1つのリンゴを食べます。」「あなたはりんごを食べる。」「あなたは1つのリンゴを食べます。」

この問題に対して、解答パターンとして数値5種、単位3種の組み合わせ15組の結果を確認します。
 ※日本語として成立しない組み合わせも含めて全て確認。
- 数値:一、1、いち、ひと、いっ
- 単位:つ、こ、個

結果(「」内が赤文字で誤りと指定された箇所)

  1. あなたは一つのりんごを食べる。
    :正解と判定。
  2. あなたは一このりんごを食べる。
    :「こ」不正解と判定。正解のはず。
  3. あなたは一個のりんごを食べる。
    :正解と判定。
  4. あなたは1つのりんごを食べる。
    :正解と判定。
  5. あなたは1このりんごを食べる。
    :「こ」不正解と判定。正解のはず。
  6. あなたは1個のりんごを食べる。
    :正解と判定。
  7. あなたはいちつのりんごを食べる。
    :「いち」不正解と判定。日本語として不成立なので正しい判定。
  8. あなたはいちこのりんごを食べる。
    :「いちこ」不正解と判定。日本語とし微妙なので正しい判定。
  9. あなたはいち個のりんごを食べる。
    :「いち」不正解と判定。日本語として微妙なので正しい判定。
  10. あなたはひとつのりんごを食べる。
    :正解と判定。
  11. あなたはひとこのりんごを食べる。
    :「こ」不正解と判定。日本語として不成立なので正しい判定。
  12. あなたはひと個のりんごを食べる。
    :「個」不正解と判定。日本語として不成立なので正しい判定。
  13. あなたはいっつのりんごを食べる。
    :「いっ」不正解と判定。日本語として不成立なので正しい判定。
  14. あなたはいっこのりんごを食べる。
    :「いっこ」不正解と判定。正解のはず。
  15. あなたはいっ個のりんごを食べる。
    :「いっ」不正解と判定。正解のはず。

改善余地がありそうな判定結果は「2、5、14、15」という結果になりました。
(この組み合わせ内では)本来日本語として成立していないものが、正答であるという誤判定はされませんでした。

誤判定があったのなら報告・レポートすればいいでしょう。という話ですが、なぜ今回これをわざわざ記述したかというと、「なぜこういう結果になったかを整理するため」です。

結果と考察:

  • 「漢字読み仮名対応」が一部されていない?:対象「2、5」
    →システム側で対応されているのであれば、一部だけされていないというのは妙ですが、ABテストの最中で導入前であれば一部だけ機能しているのは納得できます。また、漢数字で正答が用意されていたとしても、数字読み仮名は特殊である(単位によって読みが異なる)為、除外されている可能性も考えられます。
  • 「数字読み仮名対応」は一部されていない:対象「14、15」
    →この結果から現状ではシステム側で対応されていないと考えられます、もし「数字読み仮名対応」されていると感じる出題があるとすれば、それはcontributerの方が個別に手作業で入力してくださった結果でしょう。
    今回の「10」のように一部だけが正常に判定されていることを踏まえると、手作業によるものと考えるのが妥当です。

疑問2.これはどうやったら解決に近づくか?

ただの利用者である私達が誰でもできることは「報告レポート」をすること位しか思いつきません。
何かいい案が他にあればコメントを付けて頂けるとありがたいです。

蛇足

上で少し触れた、数字+単位の日本語対応は少し手間だという話について説明は不要かもしれませんが、余計なお世話としてここで少し記述します。
例えば、「1」でも「一」でも「いち」と読みます。ただし、これに続く単位が「個」の場合は「いっこ」となり、続く単位が「輪」だった場合は「いちりん」、「1つ」なら「ひとつ」、同じ数字に対しても単位が異なることで許容される数字の読みが当然変わります。
また、「1本」は「いっぽん」ですが「3本」は「さんぼん」と単位の読みが変わるパターンも考慮しなければなりません。 その仕組を開発するところまで手が回っていないのでは、と考えられます。 現状でも前述のディスカッションに挙げられたスクリーンキャプチャ画像から確認できるのと同様に

[/私は/僕は]新[/しい]記録を

といった、正規表現のような形で解答パターンをメンテンナンスする形態であれば

[1/1/一/ひと]つ
[1/1/一/いっ][個/こ]

と個別に一つ一つ手作業で追加しなければ、人間が使っていて「何か変だ」と感じないレベルにまで近づけられない仕組みなのでしょう。 とても大変な労力だと思います。 ※この程度であれば、ある程度Scriptで一気に対応してしまえそうな気もしますが。考慮しなければいけない点や内情が分かっていないので何とも言えません。

関連するディスカッションのリンク注釈:

※1. 日英コース改善のための提案(https://www.duolingo.com/comment/6496111
※2. 現在完了形の日本語訳が不自然(https://www.duolingo.com/comment/5179289

その他の関連するかもしれないディスカッション:

数字表記の方針を変更します:漢数字からアラビア数字へ(https://www.duolingo.com/comment/7992487
漢字、ひらがな、カタカナの差異で誤判定になる不具合(https://www.duolingo.com/comment/4834582

ここまで読んでくださった奇特な方へ:

長そうだから、とりあえずざーっとスクロールしてこれを目にされた方も、読んでくださりありがとうございます。今(文章公開)の時点では「利用者側から見た現状」をまとめた文で利用価値は薄いと思います。ただ、このディスカッションに最新の内情を知っている方がコメントして頂けると、利用者の「どうなってるの?」という疑問・不満が減り、さらに友好的で平和なDuolingoになっていくと良いなと思っています。 情報提供、つっこみ、などなどお待ちしてます。

2年前

3コメント


https://www.duolingo.com/kenkunpapa

no-name420 さん お疲れ様です。 まず、今回の取りまとめについては、非常に視点がしっかりしており、スローな脳みそな私にも十分理解できました。ありがとうございます。(決して上から目線ではないのでご理解を!) また、 日夜、このように運営側が真摯に努力している事とは露知らず、「俺の回答もただしいじゃねえか!」をここには書けないようなものすごい酷い言葉で感情に任せて記載した事を猛省しております。 さて、今回の件についてですが、私の意見は、概ねno-name420 さんと同じだと思います。 どこまで追求するのかという点を明確にするのであれば、日本語検定を指導できる立場(例:日本語ボランティア)をメンバーに入れることにより、外国の人が色んな日本語表示を覚えて頂く為には、いいのかなとも思いました。 日本語と英語を比較した場合、以前、OKAMOTO_Yusukeからもご指導があったのですが、日本はまず品数について明確に語らない事が有り、英語が主語については明確なのと同様に、完全一致させるのは難しいのかもしれませんね。 メンテナンス側の手間を省くのであれば、「1個」以外はNGとか、ルールを決めるべきですが、それだと私が前述した意見と相反するので、要望はいたしません。 無料で勉強させていただきながら、いつも文句を言っている感じがしてきました。ごめんなさい。

2年前

https://www.duolingo.com/no-name420
no-name420
  • 25
  • 7
  • 2
  • 290

kenkunpapaさん 長文にもかかわらず直ぐに確認いただいて、申し訳ないやらありがたいやらで、コメントまで頂きありがとうございます。簡潔にまとめようとは心がけていたのですが、始めてみると思った以上に長文になってしまいました。
大それた思いをそこまで持っている訳ではありませんが、利用者が運営側を敵対するような関係になるのは勿体無いなーという思いを持っています。人は良く分からない物に対して「ムカつく」という傾向があるように思いますので、そういう方がこれをみて溜飲を下げることに力添えできれば嬉しいと思います。(実際のところは私自身の頭のモヤモヤを整理するというのが駆動源ではあるのですが)
しかし忘れてはならないのはDuolingo自体も当然慈善事業ではないので、費用対効果を見て作業優先度を決めるのは仕方が無いことだなーとは個人的には思っています。総登録者が1億人といっても、他言語のディスカッションなどを見る限り他の言語に比べて日本語のディスカッションは賑わっていないように見えています。それは単に文化の違いというよりも、言語別に見た時に利用者の比率が日本語は圧倒的に少ないのだと思います。どうしても「日本語向け」の対応は優先的に進めることは難しいのだと思います。そうは言いながらもそれとは無関係にメンテナンスを続けて下さるボランティアの方にはとても感謝ですね。
(良く分からない文章になってしまった

2年前

https://www.duolingo.com/kenkunpapa

no-name420さんへ

すぐにお返事が出来ず、済みませんでした。 私自身、自分の周囲に日本語を勉強に来ているよその国の方々が多いのには驚いていますが、英語から比較すると、めちゃくちゃ少ないと思います。 (no-name420さんと同意見です) 今後は、自分の不正解に対し、母国語が日本語でない人の役に立つ事を祈ります。 お返事有難うございました。

2年前
言語を無料で学ぼう。1日5分ゲーム感覚で学習できます。