日本語学習者の自律学習をサポートするための機能です。入力されたテキストのリーダビリティに応じて、記述式の穴埋め問題が自動生成されます。初級レベルのテキストには助詞の問題が提示されます。中級と上級レベルのテキストには、接続詞や副詞の問題が提示されます。文章を読んだあと、学習モードを試してみてください。なお、本機能は、実験的なものであるため、β版として公開します。
以下の6つのレベルを判別します。
レベル | リーダビリティ値 | レベル感 |
---|---|---|
上級後半(とてもむずかしい) | 0.5-1.4 | 高度に専門的な文章に関しても不自由なく、理解できる。日本語のあらゆるテキストに対して困難を感じない。 |
上級前半(むずかしい) | 1.5-2.4 | 専門的な文章に関してもほぼ理解できる。文芸作品などに見られる複雑な構造についても理解できる。 |
中級後半(ややむずかしい) | 2.5-3.4 | やや専門的な文章でも大まかな内容理解ができ、日常生活レベルの文章理解においてはほぼ不自由がなく遂行できる。 |
中級前半(ふつう) | 3.5-4.4 | 比較的平易な文章に対する理解力があり、ある程度まとまった文章でも内容が把握できる。 |
初級後半(やさしい) | 4.5-5.4 | 基本的な語彙や文法項目について理解できる。テ形による基本的な複文なども理解できる。 |
初級前半(とてもやさしい) | 5.5-6.4 | 単文を中心とする基礎的日本語表現に関して理解できる。複文や連体修飾構造などの複雑な文構造は理解できない。 |
数値が大きい場合、相対的に易しいテキストです。数値が小さい場合は、相対的に難しいテキストです。例えば、「テキスト(A)」と「テキスト(B)」を解析した結果、「テキスト(A)」のリーダビリティ値は「1.5」、「テキスト(B)」は「2.4」だったとします。判別結果としては、いずれも「上級前半」として判定されますが、「テキスト(A)」は上級後半よりのやや難しいテキスト、「テキスト(B)」は中級後半よりのやや易しいテキストということになります。
リーダビリティ値が0.4未満もしくは、6.5以上の場合、測定不可になります。リーダビリティ値が0.4未満の場合、極度に難しいということになりますし、6.5以上の場合、極度に簡単(一語文の連続か文構成が不自然)であるなどの原因が考えられます。
入力された文を形態素解析し、文の平均的な長さ、動詞や助詞の含有率を文章単位で計算します。そしてリーダビリティ公式の係数を当てはめ、最適なリーダビリティレベルを算出します。
6段階のレベルに相当する基準テキスト(日本語の教科書データ900個×1000文字のテキストファイルと「現代日本語書き言葉均衡コーパス」)を言語処理のツールで解析し、線形回帰分析によって導き出した計算式です。判別結果は、形態素解析の(誤った解析の)結果により、間違うことがあります。多くの形態素解析システムは、ひらがなが続く文章(例えば、初級の会話教材など)の解析が苦手ですので、リーダビリティの推定も間違う可能性が大きくなります。
できません。本システムは、500~1,000字程度の「文章」(文の集合)に対して難易度を推定するものとして設計されています。1文だけを入れて難易度を推定したとしてもその結果は信頼できるものではありません。
本システムの直接的な参考文献はありません。ただし、以下の関連文献がありますので、ご参照ください。
上記以外の質問はFacebookグループ で受け付けています。