Panduan Teknologi Penuh Inspirasi

 


Menggali Deep Web

0
Posted March 16, 2017 by Joko Nurjadi in Know How

Jika di permukaan lautan informasi Anda dapat menemukan ikan, maka di lautan informasi yang terdalam Anda dapat menemukan monster.

Internet sudah merupakan bagian hidup sehari-hari yang nyaris tidak terpisahkan bagi banyak orang. Internet erat kaitannya dengan search engine, tempat Anda mengetikkan query untuk mendapatkan informasi yang Anda inginkan. Google sebagai search engine terpopuler melayani milyaran query setiap harinya. Namun apakah Google benar-benar dapat menemukan semua jawaban?

Surface Web vs Deep Web

Konten web yang Anda dapatkan melalui Google dan search engine pada umumnya merupakan konten yang juga dapat dilihat orang lain. Search engine melakukan crawling dan indexing tanpa henti pada berbagai website seperti blog, website berita, dan lain-lain agar konten-konten tersebut tersedia untuk user. Keseluruhan database search engine tentu memerlukan kapasitas yang luar biasa besar.

Namun konten tersebut baru sebagian kecilnya jika dibandingkan keseluruhan konten web. Konten yang ditawarkan search engine disebut dengan surface web atau permukaan web. Lalu konten web bagaimana yang bukan di permukaan web, atau bahasa kerennya: deep web?

Deep web sebenarnya bukan sesuatu yang istimewa, Anda mengaksesnya setiap hari. Contohnya saat Anda membaca e-mail, status Facebook, atau saat melakukan transaksi finansial, dan konten lainnya yang memerlukan otoritas seperti login, captcha,dan lain-lain . Konten ini tidak dapat diakses oleh search engine. Bayangkan seberapa banyak konten dan database yang tersembunyi, ibarat perpustakaan besar yang terkunci.

Mudahnya, surface web adalah semua yang dapat diakses search engine, dan sebaliknya deep web adalah semua yang tidak dapat diakses oleh search engine.

Metode Lain Menghindari Search Engine

Bukan hanya login yang dapat menghalangi search engine dalam mengorek konten deep web, terdapat beberapa metode lain. Misalnya halaman web yang berisi konten dinamis, konten ini dihasilkan tergantung dari respons sebuah query atau form. Contohnya, Anda memasukkan sebuah alamat website (contoh: instagram.com) pada Alexa.com dan menghasilkan peringkat website tersebut berdasarkan peringkat Alexa seperti terlihat pada Gambar 1.

Gambar 1. Peringkat instagram.com berdasarkan Alexa.

Konten pada Gambar 1 tersebut tidak dapat ditemukan oleh search engine pada umumnya, demikian juga konten yang dihasilkan oleh website seperti Wolfram Alpha (www.wolframalpha.com.), Similar Web (www.similarweb.com), dan lain-lain yang menggunakan mekanisme serupa.

Website yang tidak ingin dilirik oleh search engine juga dapat membatasi akses bot/crawler search engine melalui robots.txt  yang diletakkan pada top level directory website, misalnya xyz.com/robots.txt. Robots.txt merupakan sebuah standar pengecualian untuk membatasi bagian website yang tidak diperkenankan di-scan. Contoh isi robots.txt:

User-agent: *
Disallow: /

Baris “User-agent: *” diperuntukkan untuk semua bot yang mengunjungi website Anda, sementara baris “Disallow: /” memberitahukan para bot tersebut untuk tidak mengunjungi halaman mana pun dari website xyz.com.

Contoh lain:

User-agent: *
Disallow: /images/

Baris “Disallow: /images/” berarti mengecualikan folder /images/ dari bot. Anda dapat menambahkan folder lainnya yang diperlukan.

Karena hanya berupa standar kesepakatan, tentu saja keberadaan robots.txt tidak menjamin semua bot akan mematuhinya, bisa saja malware atau spambot justru menggunakannya untuk masuk dan mengorek informasi ke tempat yang seharusnya tidak diperbolehkan.

Dark Web

Pengertian deep web sering rancu dengan dark web. Dark web adalah world wide web yang berada pada jaringan terenkripsi yang hanya dapat diakses dengan cara tertentu, seperti menggunakan software atau konfigurasi yang spesifik. Setelah Anda terhubung dalam jaringan ini, baru Anda dapat mengakses konten di dalamnya. Dengan demikian, dark web adalah bagian dari deep web karena sama-sama tidak dapat diindeks oleh search engine. Konten pada dark web identik dengan hal-hal yang berbau kriminalitas.

Gambar 2 mengggambarkan bagaimana kurang lebih hubungan surface web, deep web, dan dark web. Digambarkan pada level surface web adalah website-website yang sudah sangat akrab seperti Yahoo, Google, CNN, dan seterusnya. Pada level deep web adalah database akademis, rekaman medis, data finansial, dan seterusnya. Lalu lihat pada level dark web, isinya adalah Tor (akan dibahas kemudian), protes dunia politik, perdagangan narkoba dan berbagai aktivitas ilegal. Surface web diestimasi hanya 4% dari keseluruhan konten web pada ilustrasi tersebut.

Gambar 2. Surface web – deep web – dark web.

Selamat Datang ke Jaringan Anonimitas Tor

Mari mencoba masuk ke dalam dark web dengan menggunakan salah satu jaringan anonimitas yang populer di dunia, yaitu Tor, berasal dari proyek software bernama “The Onion Router” yang mengarahkan lalu lintas Internet ke jaringan yang menyembunyikan lokasi dan kerahasiaan user, karena itulah Tor termasuk dalam jaringan anonimitas (anonimity network).

Tor dapat diunduh melalui URL www.torproject.org (Gambar 3). Software ini mendukung berbagai sistem operasi populer Windows, Mac, Linux/Unix, dan Android.

Gambar 3. Website Tor.

Setelah Anda mengunduh (saat artikel ini ditulis file yang diunduh adalah torbrowser-install-6.5_en-US.exe berukuran sekitar 48.3 MB) dan melakukan instalasi, maka Anda dapat menjalankan Tor Browser untuk pertama kalinya. Lalu Anda akan diminta untuk melakukan konfigurasi jaringan Tor seperti terlihat pada Gambar 4.

Gambar 4. Konfigurasi Jaringan Tor.

Pada banyak kasus, pilihlah opsi pertama (I would like to make a direct connection to the Tor network). Namun untuk kasus tertentu seperti jika koneksi Internet Anda disensor atau melalui proxy, maka pilih opsi kedua dan ikuti beberapa langkah konfigurasi. Berikutnya akan terbuka Tor Browser seperti pada gambar 5.

Gambar 5. Tor Browser.

Apakah tampilan Tor Browser mengingatkan Anda akan sesuatu? Ya, mirip dengan browser Mozilla Firefox. Ini tidak mengherankan karena memang Tor Browser merupakan modifikasi dari Mozilla Firefox, namun tentu dengan penggunaan yang berbeda. Jangan meng-install plugin apa pun pada Tor Browser karena dikuatirkan plugin tersebut dirancang untuk membuka identitas Anda.

Tor Browser juga menyediakan default search engine, yaitu DuckDuckGo (Anda tentu juga dapat menggunakan Google pada jaringan Tor). Berselancar dengan Tor Browser dapat mengakses website-website yang diblokir melalui ISP atau proxy. Tor Browser mampu mengakses surface web sebagaimana browser pada umumnya. Namun perhatikan jika Anda mengakses www.google.com (dengan asumsi Anda menggunakan original IP Indonesia), kemungkinan Anda tidak akan diarahkan pada www.google.co.id, melainkan pada website Google dari negara lain karena IP Anda diubah menjadi IP acak yang anonim pada jaringan Tor, contohnya seperti pada Gambar 6 yang menampilkan www.google.fr (Google Perancis).

Gambar 6. Mengakses Google dari Tor Browser.

Onionland

Selain mengakses surface web secara anonim, Tor Browser juga dapat digunakan untuk mengakses konten dark web atau disebut juga onionland, itulah sebabnya Anda melihat logo bawang (onion) pada Tor Browser. Di jaringan ini Anda dapat mengakses website dengan top level domain .onion, bukan .com atau sejenisnya. Kebanyakan domain .onion menggunakan nama domain yang sulit diingat, contohnya http://soupkso3la22ltl3.onion/ seperti terlihat pada Gambar 7. Sebuah website yang mengkritik dunia politik US.

Gambar 7. Salah satu website .onion.

Nama domain website tersebut tidak mudah diingat, dan ini baru satu website. Bagaimana dengan website-website .onion lain yang juga memiliki nama domain “ajaib”, di mana Anda dapat menemukannya? Jangan khawatir, terdapat search engine khusus untuk mencari website-website ini, yaitu Onion Link (http://onion.link).

Sebagai contoh, pada Gambar 8 terlihat Tor Browser membuka website onion.link dan mengetikkan query “hacking tool”. Seperti pada search engine umumnya, Onion Link menampilkan hasil pencarian. Namun jika dilihat, URL yang ditampilkan mengandung .onion. Jika Anda klik salah satu hasil pencarian (yaitu https://hansamkt2rr6nfg3.onion.link/category/59/), maka akan terlihat seperti pesan error seperti pada Gambar 9.

Gambar 8. Search engine Onion Link.

Gambar 9. Error saat mengakses URL.


Error tersebut terjadi karena Anda belum mengakses URL yang sebenarnya. URL .onion yang sebenarnya adalah seperti tertulis pada pesan kesalahan, yaitu hansamkt2rr6nfg3.onion. Copy paste URL .onion tersebut pada tab Tor Browser, hasilnya terlihat seperti pada Gambar 10.

Gambar 10. Sebuah konten dark web: Hansa Market.

 

Website Onion Link dapat diakses melalui jaringan Internet biasa sehingga juga dapat menampilkan seperti pada Gambar 8 dan 9, tetapi tidak Gambar 10.

Selain cara di atas, Anda juga dapat menemukan dan menjelajahi website-website .onion melalui sebuah daftar yang telah diklasifikasikan sesuai kategorinya. Salah satu website yang menyediakan daftar ini adalah The Hidden Wiki di http://7g5bqm7htspqauum.onion (Gambar 11).

Gambar 11. The Hidden Wiki.


Daftar pada The Hidden Wiki tampaknya cukup mewakili apa yang dikhawatirkan orang menyangkut konten tanpa sensor. Ada forum carding, warez, hacking, atau bahkan jual beli obat terlarang, website pornografi, sampai konten kekerasan dan kekejaman yang hanya dapat dibayangkan oleh para psikopat. Transaksi ilegal yang terjadi pada dark web biasanya menggunakan cryptocurrency seperti bitcoin yang tidak memerlukan identitas pribadi saat melakukan pembayaran. Bitcoin saat ini pun mulai digunakan pada transaksi biasa. Salah satu marketplace ilegal populer pada dark web adalah Silk Road yang menjual obat-obat terlarang, namun telah dihentikan setelah campur tangan pemerintah US dan pemilik Silk Road dipenjara seumur hidup. Bagaimanapun, berbagai marketplace lain tetap tumbuh pada belantara dark web.

Menggali Informasi Dengan Benar

Konten raksasa deep web seharusnya digunakan untuk menambah informasi bermanfaat yang tidak kita temukan pada surface web, dan bukan untuk menemukan hal-hal terlarang yang tidak bermanfaat atau bahkan menjerumuskan. Walaupun tentu saja film atau cerita fiksi lebih sering menyorot hal-hal seperti ini jika menyinggung dark web.

Lebih baik mencari informasi dengan benar, baik pada surface web maupun deep web. Anda tidak harus selalu mengandalkan Google karena ada kalanya terdapat pilihan yang lebih baik, tergantung dari apa yang Anda cari. Contohnya jika Anda ingin mencari informasi sains tentang teori dentuman besar (big bang theory). Jika Anda mencarinya di Google dengan keyword “big bang theory” maka hasil pencarian yang terlihat seperti pada Gambar 12.

Gambar 12. Google mencari “big bang theory”.

Apa yang terlihat? Hasil yang dominan bukanlah teori sains big bang, tetapi mengenai acara televisi di Amerika berjudul The Big Bang Theory. Ini dikarenakan algoritma Google mengutamakan popularitas keyword, Anda terpaksa harus mengubah query menjadi lebih spesifik seperti “big bang theory in science” atau sejenisnya agar Google memahami apa yang Anda maksud.

Ini berbeda jika Anda mencari “big bang theory” pada website Science.gov (www.science.gov), hasilnya terlihat seperti pada Gambar 13.

Gambar 13. Science.gov mencari “big bang theory”.

Terlihat hasil yang tampil adalah berbagai dokumen sains yang berhubungan dengan big bang theory. Ini jauh lebih memuaskan dibandingkan hasil pencarian Google, tentunya bagi Anda yang memang mencari informasi sains terpercaya.

Dari contoh ini terlihat bahwa kuantitas informasi bukanlah segalanya. Anda dapat mengakses semua informasi dari surface web sampai dark web, namun yang terpenting apakah informasi tersebut benar-benar dapat bermanfaat bagi Anda.

Referensi:

(Visited 442 times, 4 visits today)

Share artikel ini melalui:
Share on Facebook1Tweet about this on TwitterShare on Google+0Share on LinkedIn0Email this to someone

About the Author

Joko Nurjadi
Joko Nurjadi

... just another name and form.

Latest
 
 

Read more:
Inikah Akhir Kisah Flash Playar?

Setelah Google dan Apple menghentikan Flash Player sebagai plugin default dari browser buatan mereka dengan menggantinya dengan teknologi HTML5. Semua...

Close