highlights

2018年1月16日火曜日

自然言語処理の予習 構文の解析

はじめに

放送大学教材の「自然言語処理」を勉強することにしました。
目的はうさぽんbotを賢く運用するためです。
とりいそぎ、勉強会に出ます。

教材は下記のやつです。
自然言語処理

予習開始(2)

7章を読む。

構文の表現

構文にはいくつかの表現方法がある。
  • 依存構造表現
  • 句構造表現(←自然言語処理で使われているのはこっち
構文には曖昧性がある。与えられた文の可能な構文を求めるのと曖昧性の中から妥当と考えられる構文を選択するのを構文解析と呼ぶ。

文脈自由文法

チョムスキー標準形が教科書では何を言っているのかさっぱり分からない。まあ文字列を非終端記号2つか終端記号1つに置き換えると書いてあるので再帰的な何かを想像していれば良いとして、非終端記号と終端記号とは一体何なのかがさっぱりわからなかった。
こっちのほうを参考にして理解できた。
思うんだけど、この教科書非常に読みにくい。

CKY法

アルゴリズムの理解は諦めた。ひらっちエロい。
指数オーダーの計算量をO(n^3)にする。
曖昧性の解決は次章でやるみたい。

写経しようとも思ったけど、githubにいっぱいサンプルあったのでこれで良しとする。あかんか?あかんか…。

感想

構文解析はあんまり興味ないかもしれんと思った。

追記

日本語では依存構造表現のほうが向いているらしい。

0 件のコメント:

コメントを投稿