日本語学習者のための
コロケーション検索システム
かりん
このサイトでは、ある名詞と一緒によく使われる動詞や修飾語を探すことができます。
確認事項本システムを使用する方は、 上の「確認事項」をクリックして全項目を読んでください。全部読むと検索ができるようになります。読んだ上で検索をする場合、確認事項に同意したものとみなします。
この利用規約(以下「本規約」)は、山口大学及び大分大学の研究グループ(以下「制作者」)が本サイト上で提供する「日本語学習者のためのコロケーション検索システム『かりん』-よく一緒に使われることば-」(以下「本システム」)における利用条件を定めるものです。
本教材を利用する方(以下「ユーザー」)は、本規約に同意したものとみなします。
制作者は、本教材の改善や研究目的のために使用者の検索履歴、アンケート調査の結果などを研究のために利用し、学会などで発表することもあります。
本教材の著作権は制作者に帰属します。
本規約は2016年4月1日に制定、同日施行します。
このシステムでは『現代日本語書き言葉均衡コーパス』(国立国語研究所)を基に、名詞とどのような語が一緒に使われているかを調査し、結びつきの頻度やダイス係数(結びつきの強さを表す指数)を計算した結果を使っています。したがって実際の書き言葉でどのように使われているかを参考にして、言葉を選ぶことができます。
国立国語研究所のホームページに説明があります。現代日本語書き言葉均衡コーパス(BCCWJ)
ただし本システムで使用する際には、 教育上の理由などからデータに修正を加えている部分があります。 したがって本システムで使用されているデータの責任は、すべて制作者にあります。 詳しくは、「本システムのデータ」を見てください。
名詞・動詞、修飾語には「日本語能力試験(Japanese Language Proficiency Test)」 の旧レベルや学習指標値(Study Value Index)が 、提示名詞・動詞・修飾語(形容詞や連体詞など)には、 日本語能力試験の旧べレルと学習指標値(徳弘2006)が示されています。 表中「1-10」とあるのは、 当該の語が日本語能力試験の旧1級で学習指標値が10であることを示しています。
「学習指標値」は、徳弘(2006)で提唱された、 漢字語彙の中から頻度と単語親密度によって選択された語彙を10段階に分けた指標で、 数が多いほうが目にする機会が多く日本人になじみが深い語で 効率的に学習したい場合に優先的に学ぶ語であることを示します。 なお、学習指標値は漢語につけられたものなので、カタカナ語には学習指標値はありません。
*日本語能力試験の旧試験と現在の試験の関係については、以下を参照してください。 日本語能力試験(日本語)
*「学習指標値」の詳細は、徳弘(2006) 「日本語教育における中上級漢字語彙教育の研究」を参照してください。
名詞と動詞のコロケーションには、訳が付してあるものもあります。 訳はコロケーションの意味の1例ですので、他の意味を持つ場合もあります。 名詞と動詞の例文は、すべて作例で、訳があるものもあります。 修飾語と名詞のコロケーションには、修飾語+名詞に続く語でコーパスの中で多かった語が示されます。
それぞれのコロケーションがBCCWJコーパスの中のどのような資料でよく使われているか (「小説」か「白書」か「website」かなど)も示しています。
このシステムは、日本語学習者のためのコロケーション検索システムです。コロケーションとは、<ことばとことばのよく使われる結びつき>のことです。このシステムでは、名詞を入力して一緒に使われることが多い修飾語や動詞を探すことができます。
例えば「大きい影響、強い影響、どちらがいいか」、「『影響をあげる(誤用)』と言いたいが、どんな動詞を使ったらよいか」などのときに、使うことができます。
この語と語のむすびつきが上手に使えると、とても自然できれいな日本語になります。あなたの書き言葉の向上のために、ぜひ役立ててください。
「大きい影響か、強い影響か」、「『影響をあげる』は言えるか」などの疑問に答えるほか、そのコロケーションがどんなジャンルやスタイルでよく使われるかも、ヒントを得ることができます。
このシステムのデータは、書き言葉ですので、友達などとのおしゃべりで使うのには、適切でない表現があります。
データは、教育的配慮から、計算結果に少し加工がしてあります(漢字や助詞の変換など)。そのため生のデータと少し数が違うことがあります。論文やレポートのデータには、自分で生のデータで調べてください。
本システムの頻度やdice係数の計算には、BCCWJの「語彙素」を用いています。 BCCWJでは、例えば「ノル」と発音される「乗る」「載る」の動詞は、 同じ語彙素「乗る」として分類されています。 したがって本システムでも、「乗る」の頻度は、 語彙素で「乗る」となっているもの(「乗る」と「載る」の合計)を使用しており、 dice係数もその頻度に基づいて計算しています。
本システムでは、例えば「バス」「新聞」と共起する「ノル」は、 両方とも同じ「ノル(「乗る」+「載る」)の頻度で計算されていますが、 検索結果として画面に表示される動詞の表記は、教育的配慮から、 後者の「新聞にノル」のような場合は表記「載る」に書き換える作業を行っています。
本システムでは、名詞と動詞のコロケーションを検索する際には、 正規表現によって「名詞」+助詞+(副詞がひとつまで挿入可能)+動詞」というパターンを コーパスの中から検索しています。 そのため「動詞」は活用形に関係なくすべて同じ動詞は足し算した数が頻度として数えられており、 自動詞は「が」、他動詞は「を」と辞書形で提示しています。
以下は、名詞と動詞のコロケーション(よく一緒に使われることば)を覚えるための学習支援サイト「nagareboshi」です。 無料で練習できますので、ぜひ活用してください。 モバイル端末(スマホ、タブレットなど)対応です。
本研究はJSPS科研費25370591の助成を受けたものです。
またコロケーションデータ作成に「現代書き言葉均衡コーパス」、(国立国語研究所)、 学習者への語の重要度の指標に「学習指標値」(名古屋大学、徳弘康代先生)を使用させていただきました。
この場をお借りしてお礼申し上げます。