NATURAL LANGUAGE PROCESSING (PEMROSES BAHASA ALAMI) DALAM ARTIFICIAL INTELEGENCE


 

NATURAL LANGUAGE PROCESSING (PEMROSES BAHASA ALAMI) DALAM ARTIFICIAL INTELEGENCE



Definisi

Pemroses bahasa alami (Natural Language Processing/NLP) adalah suatu aplikasi (program) dalam bidang AI yang dapat mengartikan suatu bahasa baik bahasa tulisan maupun bahasa lisan atau memproses masukan yang berupa bahasa menjadi suatu informasi atau pengetahuan

Yang menjadi pembahasan bukan bagaimana bahasa diinput atau dimasukkan kedalam program, tetapi lebih kepada bagaimana mengartikan suatu bahasa atau mengcopy / mengambil informasi/pengetahuan dari suatu bahasa.

 

Pembagian NLP

Masalah pemrosesan bahasa alami dibagi menjadi dua bagian besar, yaitu :

1.            Pemrosesan Naskah Tertulis

menggunkan pengetahuan tentang leksikal, sintax, dan

semantik

2.            Pemrosesan Bahasa Lisan

menggunakan semua pengetahuan dari pemrosesan naskah tertulis ditambah pengetahuan tentang phonology.

 

Masalah dalam NLP

Beberapa masalah yang dihadapi dalam pemrosesan bahasa alami antara lain adalah :

1.            Suatu kalimat sering kali tidak lengkap, artinya tidak memberi informasi yang jelas atau lengkap

2.            Satu kalimat dapat memiliki lebih dari satu pengertian

dalam konteks yang berbeda

3.            Tidak ada program pemroses bahasa alami yang cukup lengkap karena bahasa selalu berkembang, kosa kata selalu bertambah.

4.            Bisa terdapat lebih dari satu cara (lebih dari satu kalimat) untuk mengungkapkan hal(maksud) yang sama.

 

Tahapan Proses

Untuk memproses bahasa alami diperlukan 5 langkah sebagai berikut :

1.            Analisis Morpology

Pada tahap ini dilakukan analisa untuk setiap kata dan komponen yang dimiliki tiap kata termasuk token non kata seperti spasi, tanda baca, tanda pemisah.

2.            Analisis Sintax

Pada tahap ini sederetan kata disusun kedalam struktur yang memperlihatkan bagaimana hubungan satu kata dengan kata lainnya. Deretan kata akan ditolak bila tidak memenuhi aturan penyusunan kata yang ada

3.            Analisis semantik

Pada tahap ini struktur deretan kata yang sudah terbentuk akan diberi arti. Dengan kata lain pemetaan dibuat antara struktur sintax dengan object yang berhubungan.

             Penyatuan Arah (konteks)

Pada tahap ini arti dari suatu kalimat disesuaikan dengan kalimat-kalimat lain, karena arti dari suatu kalimat biasanya berhubungan dengan kalimat sebelumnya dan kalimat sesudahnya.

5.            Analisis Pragmatis

Struktur yang terbentuk menghasilkan interpretasi ulang dari apa yang sudah dikatakan atau ditulis sebelumnya dengan arti yang sebenarnya.

 

Grammar dan Parsers

             Grammar adalah suatu aturan yang menentukan bagaimana suatu kalimat dalam suatu bahasa dibentuk. Grammar berisi kumpulan sintax yang baku/benar dari suatu bahasa.

Contoh : Dalam bahasa Indonesia, suatu kalimat biasanya terdiri dari

Subject-Predikat-Object-Keterangan

             Parsers adalah suatu metode atau suatu program (sering disebut suatu mesin) yang dapat memproduksi/menghasilkan kalimat atau bahasa yang sesuai dengan Grammar yang sudah ditentukan atau diinginkan. Parsers juga dapat memeriksa apakah suatu kalimat yang dimasukkan sesuai dengan Grammar atau tidak.

 

Jenis Parsers

Parsers terdiri dari dua jenis, yaitu :

1.            Top-Down Parsing

memulai proses parsing dari simbol start dan menggunakan aturan grammar sampai simbol-simbol terminal pada tree terhubung ke komponen kalimat yang di parsing

2.            Bottom-Up Parsing

memulai proses parsing dari kalimat yang akan di parsing dan menggunakan aturan grammar secara terbalik untuk memproduksi kata menjadi terminal, terminal menjadi kalimat sampai tree/ pohon lengkap dan simbol start tercapai.

Tidak ada komentar:

Posting Komentar