Mencoba Fitur Google BigQuery Sandbox

Prasyarat

  • Pengetahuan dasar SQL
  • Pengetahuan dasar Komputasi Awan ( Cloud Computing )
  • Jika belum pernah mempelajari 2 hal di atas maka dapat juga mengikuti tutorial ini

Tujuan

  • Mengenal apa itu Google BigQuery
  • Mencoba BigQuery gratis menggunakan Sandbox

Apa itu BigQuery ?

BigQuery adalah gudang data ( data warehouse ) yang tidak memiliki server ( serverless ), dapat mengkueri data dalam skala petabyte, dirancang untuk membuat semua analis data anda produktif dengan kinerja tinggi dengan harga yang relatif murah. Karena tidak ada infrastruktur untuk dikelola, jadi kita dapat fokus pada menganalisis data untuk menemukan wawasan yang bermakna menggunakan SQL tanpa perlu administrator database.

BigQuery memungkinkan anda untuk menganalisis data secara realtime menggunakan kemampuan streaming data sehingga menghasilkan wawasan selalu terkini dan gratis hingga 1 TB data yang dianalisis setiap bulan dan 10 GB data yang disimpan.

Untuk menggunakan BigQuery bagi permula, Google menawarkan 2 opsi yaitu menggunakan Sandbox dan Gratis uji coba

Perbedaan BigQuery Sandbox and GCP Gratis ujicoba

  1. Google Cloud Platform (GCP) memiliki dua penawaran. Yang pertama menggunakan BigQuery Sandbox yaitu, inisiatif khusus BigQuery untuk memberikan akses mudah ke BigQuery tanpa perlu menggunakan kartu kredit untuk mendaftar. Jika anda hanya ingin bereksperimen dengan BigQuery sekarang dan produk-produk GCP lainnya setelahnya, maka BigQuery Sandbox patut dicoba untuk memulai. Masuk ke link https://cloud.google.com/bigquery/ dan klik pada TRY BIGQUERY FREE (oval hijau)

  2. Uji coba gratis GCP mencakup kredit $ 300 yang berlaku di semua produk Google Cloud Platform (GCP). Jika anda ingin bereksperimen dengan beberapa produk, maka Anda dapat mengaktifkan uji coba gratis GCP melalui link berikut https://cloud.google.com/free/. Catatan : uji coba gratis memerlukan kartu kredit.

Persiapan

Masuk ke link https://cloud.google.com/bigquery/ dan klik pada tombol TRY BIGQUERY FREE ( yang di lingkari orange), lalu login menggunakan akun Gmail anda. Untuk opsi tombol Try free pojok kanan atas yaitu Uji coba gratis yang diharuskan menggunakan kartu kredit.

Centang persyaratan layanan dan klik TERIMA . Kemudian klik BUAT .

Buat Project name dengan nama yang unik contohnya bigquery-sandbox lalu pilih tombol Create .

Maka anda akan di arahkan pada halaman tampilan BigQuery berikut ini. Bisa dilihat bahwa ada tulisan SANDBOX pada pojok kiri atas dan anda sekarang dapat menggunakan gratis kueri 1 TB dan pemyimpanan tabel 10gb yang dihapus ( di reset ) setiap bulan nya. Untuk menjalan kueri sql bisa di ketik di kolom Query editor .

Selain itu BigQuery juga menyediakan banyak datasets bigquery-public-data ( pada kolom sebelah kiri ) yang kita bisa digunakan secara gratis.

Sekarang kita coba kueri data education world bank dari bigquery-public-data . Ketikan perintah sql berikut ini pada kolom Query editor .

SELECT * FROM `bigquery-public-data.world_bank_intl_education.international_education` LIMIT 1000

Hasil kueri tabel bisa dilihat pada Preview

Setelah kita mencoba kueri tabel, tabel ini bisa kita simpan dalam project id kita agar dapat digunakan kembali.

Klik project id bigquery-sandbox-235419 ( kolom sebelah kiri ) . Lalu klik tombol CREATE DATASET ( kolom sebelah kanan ) maka akan muncul tampilan seperti dibawah ini. Ketik nama dataset id dalam hal ini my_dataset dan Create dataset .

Sekarang kita akan simpan kueri data world bank education tadi ke dalam my_datasets.

Pilih Query history ( kolom sebelah kiri ). Klik hasil kueri yang meiliki centang hijau dan Open query in editor.

Piilh BigQuery table

Simpan hasilnya di my_datasets dan berikan nama tabel yang unik contoh worldbank_edu .

Nah sekarang kita bisa lihat tabel worldbank_edu sudah disimpan ke dalam my_datasets . Kemudian coba kueri lagi klik tombol QUERY TABLE ( kolom sebelah kanan ) .

Pada kotak berwarna kuning Query complete (0.0 sec elapsed, cached) terlihat hasil kueri di proses 0 detik dengan cached . Yang artinya tidak di kenakan biaya pada saat kueri. Walaupun mendapatkan kuota 1tb namun kita juga dapat menghemat dengan menggunakan cached ( temporary table ). Ini penting sekali jika kita sudah mengaktifkan billing untuk mengerjakan project yang lebih besar, maka kita dapat menghemat biaya. Jadi kita hanya memerlukan 1 kali kueri yang dibutuhkan lalu menyimpan nya ke dalam datasets yang kita buat kemudian menganalisisnya.

Kesimpulan

BigQuery merupakan tools kueri sql dengan data skala besar yang dapat kita gunakan sebagai gudang data dan analisis yang sangat patut dicoba. Dengan biaya yang relatif murah dibandingkan dengan menyediakan insfrastruktur database, BigQuery adalah tools yang tepat jika kita tidak ingin repot lagi men setting karena bisa langsung digunakan. Selain itu BigQuery juga menyediakan layanan api yang bisa digunakan untuk mengkoneksikan ke banyak aplikasi, sehingga banyak opsi yang digunakan selain hanya melakukan kueri pada Query editor BigQuery. Seperti di koneksikan pada bahasa pemrograman Python atau analisis visualisasi menggunakan Jupyter notebook.

Sumber

Share on Twitter | Discuss on Twitter

Stay in touch

Like the posts you see here? Sign up to get notified about new ones.