言語情報科学
Computational Linguistics

言語情報科学
Computational Linguistics
日本語、英語などの自然言語の計算機処理に関する基礎的項目の概観と応用の紹介を行う。特にこの授業ではテキストとして書かれた言語の処理を扱う。 前半では言語学に立脚する自然言語処理について述べる。すなわち、意味を持つ最も小さな言語単位である形態素の解析から初めて順次より大きな言語単位の処理に進む。すなわち、句、節、文、そして文の連続である談話である。 中盤は1990年代以降盛んになった統計学に基礎を置く、いわゆる統計的自然言語処理の基礎について説明する。 後半は統計的自然言語処理の重要な応用、すなわち情報抽出、要約、機械翻訳、情報検索について紹介する。 最終回は以上で説明してきたことを総括して、その歴史的意義付けと未来の方向性を議論する。 This course is to provide students with an overview of natural language processing in Japanese and English by exploring its basic and advanced topics. The processing of text in these languages is the focus of this lecture series. The first half of the course covers natural language processing based on linguistics. Starting from the analysis of morpheme, the smallest unit of language that bears a meaning, students proceed with the processing of larger linguistic units, such as phrase, clause, sentence, and dialogue, or the sequence of sentences. For the middle part of the course, statistical natural language processing is explained, which depends upon statistics that has become popular since 1980's. Various important applications of statistical natural language processing, such as information retrieval and extraction, summarization, machine translation, and search inquiry are introduced during the latter part of the course. The final lecture is for a wrap up of what has been explained in the course to review and discuss its historical perspective and future trend.