よくある質問

Q 難易度のレベル分けはどのようになっていますか。

以下の6つのレベルを判別します。

レベルリーダビリティ値レベル感
上級後半(とてもむずかしい)0.5-1.4 高度に専門的な文章に関しても不自由なく、理解できる。日本語のあらゆるテキストに対して困難を感じない。
上級前半(むずかしい)1.5-2.4 専門的な文章に関してもほぼ理解できる。文芸作品などに見られる複雑な構造についても理解できる。
中級後半(ややむずかしい)2.5-3.4 やや専門的な文章でも大まかな内容理解ができ、日常生活レベルの文章理解においてはほぼ不自由がなく遂行できる。
中級前半(ふつう)3.5-4.4 比較的平易な文章に対する理解力があり、ある程度まとまった文章でも内容が把握できる。
初級後半(やさしい)4.5-5.4 基本的な語彙や文法項目について理解できる。テ形による基本的な複文なども理解できる。
初級前半(とてもやさしい)5.5-6.4 単文を中心とする基礎的日本語表現に関して理解できる。複文や連体修飾構造などの複雑な文構造は理解できない。

Q リーダビリティ値の幅はどのように解釈したら良いですか。

数値が大きい場合、相対的に易しいテキストです。数値が小さい場合は、相対的に難しいテキストです。例えば、「テキスト(A)」と「テキスト(B)」を解析した結果、「テキスト(A)」のリーダビリティ値は「1.5」、「テキスト(B)」は「2.4」だったとします。判別結果としては、いずれも「上級前半」として判定されますが、「テキスト(A)」は上級後半よりのやや難しいテキスト、「テキスト(B)」は中級後半よりのやや易しいテキストということになります。

Q 「測定不可」と出ましたが、どういう意味ですか。

リーダビリティ値が0.4未満もしくは、6.5以上の場合、測定不可になります。リーダビリティ値が0.4未満の場合、極度に難しいということになりますし、6.5以上の場合、極度に簡単(一語文の連続か文構成が不自然)であるなどの原因が考えられます。

Q リーダビリティ値(難易度)はどのように推定していますか。

入力された文を形態素解析し、文の平均的な長さ、動詞や助詞の含有率を文章単位で計算します。そしてリーダビリティ公式の係数を当てはめ、最適なリーダビリティレベルを算出します。

Q リーダビリティ公式とは何ですか。

6段階のレベルに相当する基準テキスト(日本語の教科書データ900個×1000文字のテキストファイルと「現代日本語書き言葉均衡コーパス」)を言語処理のツールで解析し、線形回帰分析によって導き出した計算式です。判別結果は、形態素解析の(誤った解析の)結果により、間違うことがあります。多くの形態素解析システムは、ひらがなが続く文章(例えば、初級の会話教材など)の解析が苦手ですので、リーダビリティの推定も間違う可能性が大きくなります。

Q 1文レベル(例:太郎が学校に行きました)の難易度を判別することもできますか。

できません。本システムは、500~1,000字程度の「文章」(文の集合)に対して難易度を推定するものとして設計されています。1文だけを入れて難易度を推定したとしてもその結果は信頼できるものではありません。

Q 本システムのリーダビリティ値(難易度)の推定方法に関する参考文献はありますか。

本システムの直接的な参考文献はありません。ただし、以下の関連文献がありますので、ご参照ください。

  1. 李在鎬・長谷部陽一郎・柴崎秀子(2009)「読解教育支援のためのリーダビリティー測定ツールについて」,言語処理学会2009年次大会(鳥取大学)
  2. 李在鎬(2011)「大規模テストの読解問題作成過程へのコーパス利用の可能性」『日本語教育』148号, pp.84-98.(http://jhlee.sakura.ne.jp/geo-backup/paper/lee2011.pdf
  3. 李在鎬・柴崎秀子(2012)「文章の難易度と語彙の関連性に関する考察~学年の違いを特徴づける語彙的要素とは何か~」『コーパスとテキストマイニング』, 共立出版, pp.181-192.
  4. 柴崎秀子・原信一郎(2010)「学年を難易尺度とする日本語リー ダビリティー判定式」『計量国語学』27(6), pp.215-232.
Q 他の質問があるのですが・・・。

上記以外の質問は質問掲示板で受け付けています。