Beyond the Scientific Way

Fahmi Amhar Official Blog

Archive for August, 2008

GIS untuk Pemetaan Bahasa

Friday, August 15th, 2008

GIS untuk Pemetaan Bahasa

Dr.-Ing. Fahmi Amhar

Abstrak

Dengan perangkat Sistem Informasi Geografi (GIS), data sebaran bahasa, dialek dan fonem akan lebih mudah untuk disajikan dan dianalisis.  Pada tulisan ini akan disampaikan beberapa bentuk analisis serta penyajian data bahasa dengan GIS, dari sekedar presentasi hingga korelasi spasial antar “layer” bahasa, sintesis data sebaran bahasa dengan data statistik, serta simulasi dengan GIS untuk menunjang aktivitas penelitian bahasa, misalnya untuk menentukan area kerja.

1      Sistem Informasi Geografi

GIS adalah sistem berbasis komputer yang didesain untuk mengumpulkan, menyimpan dan menganalisis obyek-obyek serta fenomena, di mana lokasi geografi adalah karakteristik penting atau kritis terhadap hasil analisis (Aronoff, 1989).

Dengan GIS data yang telah diakuisi dari dunia nyata akan lebih mudah ditata sehingga lebih fleksibel diakses, diteliti lebih dalam, dianalisis serta disajikan, untuk kemudian dijadikan alat bantu para pengambil keputusan (decission support system) dalam bertindak di dunia nyata.

Sementara itu data sebaran bahasa, dialek dan fonem dapat dipandang sebagai atribut yang tercode atas suatu lokasi geografi, baik dengan kode wilayah, batas administrasi, atau juga batas-batas budaya baik yang ditentukan dengan perkiraan maupun yang diukur dengan alat seperti Global Positioning System (GPS).

Salah satu software GIS yang banyak dipakai di Indonesia – dan kemudian dijadikan alat eksperimen dalam tulisan ini adalah Arc/View dari ESRI.  Arc/View adalah suatu software yang memiliki kemampuan database dan sekaligus penyajian secara spasial.  Dalam Arc/View, data geometri dapat dimasukkan (didigitasi langsung); diimpor dari format software lain; diedit; ditambahkan berbagai data attribut; disajikan secara selektif menurut kriteria lokasi atau thema tertentu dengan berbagai variasi bentuk tampilan (jenis simbol, warna atau arsiran); dikombinasikan dengan berbagai data yang berbeda (seperti spatial join, intersection, union, …) dsb.  Kemampuan semacam ini hanya ada dalam software-software GIS, dan belum ada dalam software grafika seperti Corel Draw atau software editing seperti AutoCAD.

Selain Arc/View – yang harga resminya relatif mahal – ada juga software GIS yang lebih murah – dengan kemampuan lebih terbatas – misalnya Mapinfo, atau bahkan software GIS yang sama sekali gratis, misalnya GRASS atau TatukGIS.

 

 

Gambar 1 – Tampilan software Arc/View (tampilan warna-warni tiap kecamatan)
dan TatukGIS (tampilan desa yang terseleksi oleh lingkaran)

 

2        Analisis Sebaran Bahasa dengan GIS

Data spasial dan data atribut bahasa dapat digunakan bersama-sama untuk membuat peta tematik (special purpose maps) dan untuk mendapatkan suatu informasi atas area geografi tertentu.  Data tersebut juga dapat dipakai untuk analisis yang lebih khusus, di antaranya adalah pengalamatan suatu fenomena yang hanya diketahui dalam dialek tertentu (address matching), pengelompokan komunitas berdasarkan bahasa atau dialek yang dominan (district delineation) hingga seleksi route untuk suatu pekerjaan tertentu yang terkait bahasa (route selection).

Bentuk data yang paling sederhana adalah pencacahan bahasa atau dialek yang digunakan per satuan administrasi.  Untuk bahasa daerah yang dominan, barangkali satuan administrasi kabupaten / Kota dapat digunakan.  Pusat Bahasa adalah organ di bawah Depdiknas, yang juga memiliki jaringan dinas-dinas di setiap Kabupaten / Kota.  Untuk itu tidak terlalu sulit kiranya untuk melakukan inventarisasi – misalnya dengan mengetahui bahasa daerah yang diajarkan sebagai muatan lokal di sekolah-sekolah di Kabupaten / Kota tersebut.  Dengan itu akan didapatkan tabel dengan dua kolom utama: KabKota – Bahasa.  Tentunya akan ada sejumlah daerah dengan bahasa yang sama.

Berikut ini adalah contoh simulasi untuk wilayah propinsi.


Tabel-1 Data simulasi sebaran bahasa daerah yang dominan di tiap provinsi

 

PROVINSI

Bahasa Daerah yang Dominan

PROVINSI

Bahasa Daerah yang Dominan

NANGGROE ACEH DARUSSALAM

Aceh

NUSATENGGARA BARAT

Sasak

SUMATERA UTARA

Melayu

NUSATENGGARA TIMUR

Sasak

RIAU

Melayu

KALIMANTAN BARAT

Dayak

KEPULAUAN RIAU

Melayu

KALIMANTAN TENGAH

Dayak

SUMATERA BARAT

Minang

KALIMANTAN TIMUR

Dayak

JAMBI

Melayu

KALIMANTAN SELATAN

Banjar

BENGKULU

Melayu

SULAWESI UTARA

Manado

SUMATERA SELATAN

Melayu

GORONTALO

Gorontalo

BANGKA-BELITUNG

Melayu

SULAWESI TENGAH

Kaili

LAMPUNG

Lampung

SULAWESI BARAT

Bugis

BANTEN

Banten

SULAWESI SELATAN

Makassar

DKI JAKARTA

Betawi

SULAWESI TENGGARA

Bugis

JAWA BARAT

Sunda

MALUKU

Ambon

JAWA TENGAH

Jawa

MALUKU UTARA

Ternate

DAERAH ISTIMEWA YOGYAKARTA

Jawa

PAPUA

Papua

JAWA TIMUR

Jawa

IRIANJAYA BARAT

Papua

BALI

Bali

 

 

 

 Gambar 2 – Tampilan peta sebaran bahasa daerah
Geometri Kabupaten berdasarkan data dari Pusat PDRTR Bakosurtanal, 2005
Attribut bahasa daerah yang dominan berdasarkan data simulasi

 

Sedang untuk dialek, diperlukan satuan administrasi yang lebih rinci, misalnya Kecamatan, atau bahkan Desa.  Pembagian ini tidak harus kaku, karena tentunya akan ada data yang hanya dapat / perlu dilacak ke level kecamatan saja, ada juga daerah yang diperlukan pelacakan sampai desa – misalnya di Papua di mana area kecamatan sangat luas dan dihuni oleh berbagai suku yang memiliki dialek berbeda-beda.

 

 

Gambar 3 – Tampilan peta sebaran dialek di Kab. Puncak Jaya pada Arc/View
Geometri Desa berdasarkan data dari BPS, 2003
Attribut dialek berdasarkan data simulasi (disamakan dengan Kecamatan)

 

Selain itu harus disadari adanya sebaran dialek yang bahkan lebih rinci lagi dari area desa, sehingga tidak dapat dipetakan sesuai batas administratifnya.  Untuk itu dapat digunakan simbol (point) pada koordinat tempat dialek ditemukan (pada umumnya centroid suatu permukiman), atau grafik tambahan (theme / layer terpisah) bahkan dapat overlap dengan batas administratif.

Secara umum, batas sebaran bahasa memang harus ditaruh pada layer terpisah dari batas administrasi karena memiliki sifat-sifat yang berbeda.  Namun di sisi lain dibutuhkan mekanisme untuk menjamin agar dapat dilakukan link dengan berbagai data yang hanya bisa diakses sesuai batas administrasi – misalnya data statistik kependudukan atau ekonomi.

Penggunaannya antara lain untuk mengetahui bahasa apa yang penuturnya paling sedikit, atau ekonominya pada level terrendah – sehingga dikhawatirkan bahasa itu akan punah.  Pada sisi lain, peta bahasa ini dapat digunakan untuk agregasi daerah-daerah dengan kultur budaya yang kurang lebih homogen – karena bahasa dapat menunjukkan pola budaya yang mirip.

Pada level yang lain terdapat pemetaan penggunaan fonem untuk objek yang sama, misalnya Air – Ayer – Aik – Cai.  Peta fonem ini jauh lebih terbatas, dan tersedia dalam bentuk tabel-tabel dengan dua kolom utama: Fonem – KodeWilayah, di mana daerah ini sering diisi dengan data kode daerah secara sekuensial, misalnya sebagai berikut:

 

Fonem Kode daerah tempat ditemukannya
Fonem-1 1, 3, 5-8, 11
Fonem-2 2,4,10
Fonem-3 9

 

Bentuk kolom ini harus diubah agar memenuhi syarat sebagai data relasional dengan kunci pada lokasi, sehingga kolom KodeWilayah harus ditaruh di depan.

 

KodeDaerah Fonem yang ditemukan

1

Fonem-1

2

Fonem-2

3

Fonem-1

4

Fonem-2

5

Fonem-1

6

Fonem-1

7

Fonem-1

8

Fonem-1

9

Fonem-3

10

Fonem-2

11

Fonem-1

 

Selain itu ada juga bentuk tabel di Pusat Bahasa yang berisi ratusan kolom (sehingga kertas tabel itu digulung seperti perkamen kuno).  Setiap kolom pada baris pertama s.d ketiga berisi informasi wilayah (mungkin Kabupaten-Kecamatan-Desa).  Kemudian di bawahnya berisi daftar fonem.

 

Kab Kab-A Kab-A Kab-A Kab-B Kab-B
Kec Kec-a Kec-a Kec-b Kec-a Kec-b
Desa Desa-1 Desa-2 Desa-1 Desa-1 Desa-1
Fonem-1 Fonem-Aa1-1 Fonem-Aa2-1 Fonem-Ab1-1 Fonem-Ba1-1 Fonem-Bb1-1
Fonem-2 Fonem-Aa1-2 Fonem-Aa2-2 Fonem-Ab1-2 Fonem-Ba1-2 Fonem-Bb1-2
Fonem-3 Fonem-Aa1-3 Fonem-Aa2-3 Fonem-Ab1-3 Fonem-Ba1-3 Fonem-Bb1-3
Fonem-4 Fonem-Aa1-4 Fonem-Aa2-4 Fonem-Ab1-4 Fonem-Ba1-4 Fonem-Bb1-4
Fonem-5 Fonem-Aa1-5 Fonem-Aa2-5 Fonem-Ab1-5 Fonem-Ba1-5 Fonem-Bb1-5
Fonem-n Fonem-Aa1-n Fonem-Aa2-n Fonem-Ab1-n Fonem-Ba1-n Fonem-Bb1-n

 

Tabel inipun harus ditransposisi.  Ada beberapa cara yang bisa dilakukan, misalnya dengan Excel (fungsi TRANSPOSE(array)).  Yang penting adalah huruf fonetik yang dipakai bisa terus dipakai di Excel dan nantinya di Arc/View.

 

Kode Fonem-1 Fonem-2 Fonem-3 Fonem-4 Fonem-5 Fonem-n
Aa1 Fonem-Aa1-1 Fonem-Aa1-2 Fonem-Aa1-3 Fonem-Aa1-4 Fonem-Aa1-5 Fonem-Aa1-n
Aa2 Fonem-Aa2-1 Fonem-Aa2-2 Fonem-Aa2-3 Fonem-Aa2-4 Fonem-Aa2-5 Fonem-Aa2-n
Ab1 Fonem-Ab1-1 Fonem-Ab1-2 Fonem-Ab1-3 Fonem-Ab1-4 Fonem-Ab1-5 Fonem-Ab1-n
Ba1 Fonem-Ba1-1 Fonem-Ba1-2 Fonem-Ba1-3 Fonem-Ba1-4 Fonem-Ba1-5 Fonem-Ba1-n
Bb1 Fonem-Bb1-1 Fonem-Bb1-2 Fonem-Bb1-3 Fonem-Bb1-4 Fonem-Bb1-5 Fonem-Bb1-n
 

 

Penggambarannya adalah dengan langsung memplot fonem yang berfungsi sebagai atribut itu pada posisinya (pada Arc/View fungsi AutoLabel).  Idealnya peta fonem ini dibuat setiap lembar untuk satu jenis objek, sehingga bila ada 250 objek maka akan tercipta 250 lembar peta se Indonesia, yang tiap lembarnya berisi varian-varian istilah untuk objek yang sama.

Misalnya untuk objek “sungai”, di Aceh disebut “Alue”, di Sumatera Selatan “Way”, di Jawa Barat “Ci”, di Jawa Tengah “Kali” hingga di Timor “Mota”.  Para ahli toponimi biasa mengenali bahwa istilah-istilah tersebut adalah nama generik untuk sungai (lihat Spesifikasi Pemetaan Rupabumi).  Tentu saja spesifikasi dari objek air tersebut (misalnya ukuran sungai) di tiap bahasa tetap bisa bervariasi.

Dapat juga yang dipetakan adalah arti dari bunyi / ucapan yang sama di berbagai tempat, sehingga bila suatu kata – misalnya – “atos” memiliki banyak arti (“sudah” di Jawa Barat, “keras” di Jawa Tengah, dan sebagainya), maka yang dijadikan judul peta adalah “atos”.

3. Analisis Lanjut dengan GIS-Bahasa

Teknik Address-Matching memungkinkan berbagai data dari file terpisah digabungkan dengan suatu common georeferenced address, misalnya data sebaran bahasa dengan data populasi, pendapatan perkapita dengan distribusi sekolah.  Dengan demikian bisa didapat berapa jumlah penutur suatu bahasa daerah / dialek, dan apakah mereka tergolong komunitas yang sejahtera.  Suatu bahasa lokal yang hanya ditututkan oleh kalangan yang secara ekonomi kurang beruntung serta kurang berpendidikan, dapat dipastikan lambat laun akan hilang.  Bila ternyata di masa silam pada bahasa itu tersimpan khasanah ilmu pengetahuan (lontar-lontar kuno berisi sejarah, pusaka atau resep obat-obatan), maka ilmu pengetahuan inipun akan terkubur bersamanya.

Gambar 4.  Contoh variasi sajian statistik dari penutur bahasa

Bahkan teknik ini memungkinkan melakukan sintesis antara data statistik dengan non-statistik, untuk mengetahui korelasi di antara mereka, dengan syarat, masing-masing data memiliki relevansi geografi.  Contoh analisis dengan metode ini adalah untuk mendapatkan korelasi antara kemiskinan di suatu tempat dengan penguasaan / penggunaan bahasa / dialek yang dominan.

Dalam hal data yang dipakai hanya data statistik, sebenarnya bisa diterapkan GIS “non-geometrik”, misalnya hanya menggunakan kode wilayah atau topologi sederhana.  Untuk analisis non geometrik, dari peta rupabumi sebenarnya cukup diambil kelas batas administrasi dan kelas nama-nama geografi, atau maksimal kelas jaringan jalan (untuk topologinya).

Teknik District Delineation adalah prosedur untuk mendefinisikan suatu area secara kompak dengan satu atribut atau lebih.  Misalnya untuk membagi daerah sosialisasi suatu program pemerintah berdasarkan populasi dengan bahasa lokal yang kurang lebih sama – sehingga diasumsikan memiliki budaya yang mirip.  Informasi bahasa didapat dari data atribut sedang informasi untuk mendefinisikan batas diambil dari data spasial.

4  Kesimpulan

GIS mempermudah penyajian data sebaran bahasa, membuka serangkaian analisis baru yang terintegrasi dengan data spasial dari peta dasar digital, serta mempermudah aktivitas survey statistik sendiri.  Namun kualitas hasil analisis dengan GIS tidak akan berbeda jauh dengan kualitas data yang merupakan masukkannya, bahkan bisa jadi kualitas analisis ini akan lebih jelek dari kualitas data bila petugas analis tidak memperhatikan tingkat akurasi maupun tingkat kemutakhiran data yang dipakainya.

Referensi

Amhar, F. (1999) GIS untuk Analisis dan Penyajian Data Statistik; presented paper pada Seminar “Statistika Sebagai Solusi Problematika Ilmiah dan Bisnis” BPS, Jakarta 20 April 1999

Aronoff (1989): Geographic Information Systems: A Management Perspective.  WDL Publ. Ottawa. 294 pp.

Bakosurtanal (2003): Spesifikasi Pemetaan Rupabumi.

Prahasta, E. (2002): Sistem Informasi Geografis: tutorial-ArcView.  Informatika, Bandung.


 

[1] disampaikan pada workshop “GIS untuk Pemetaan Bahasa”
Pusat Bahasa Depdiknas, Jakarta 24 Maret 2006

[2] Peneliti pada Lab Pemetaan Digital, Pusat Pemetaan Dasar Rupabumi dan Tata Ruang (PDRTR)
Badan Koordinasi Survey dan Pemetaan Nasional, Jl. Raya Jakarta-Bogor Km. 46 Cibinong
Telp/fax. (021) 87901254,  email: famhar@yahoo.com