Optimasi Query MongoDB dengan Aggregation Pipeline dan Indexing

Backend

Optimasi Query MongoDB dengan Aggregation Pipeline dan Indexing

Penulis : Fitri Hy
Tanggal : 2025-02-04

MongoDB adalah database NoSQL yang populer karena fleksibilitasnya dalam menangani data berbasis dokumen. Namun, tanpa optimasi yang tepat, query yang kompleks dapat memperlambat performa. Dua teknik utama yang bisa digunakan untuk mengoptimasi query MongoDB adalah Aggregation Pipeline dan Indexing. Artikel ini akan membahas kedua teknik tersebut serta bagaimana menggunakannya secara efektif.

1. Memahami Aggregation Pipeline

Apa Itu Aggregation Pipeline?

Aggregation Pipeline adalah fitur powerful di MongoDB yang memungkinkan pengguna melakukan manipulasi dan analisis data secara efisien. Konsepnya mirip dengan SQL GROUP BY, tetapi dengan kemampuan yang lebih fleksibel.

Tahapan dalam Aggregation Pipeline

Aggregation Pipeline terdiri dari beberapa tahap (stages) yang diproses secara berurutan. Beberapa tahapan yang sering digunakan antara lain:

$match: Menyaring dokumen berdasarkan kondisi tertentu (mirip dengan WHERE di SQL).
$group: Mengelompokkan dokumen dan menerapkan fungsi agregasi seperti sum, avg, max, dan min.
$project: Memilih atau memodifikasi field dalam hasil akhir.
$sort: Mengurutkan data berdasarkan kriteria tertentu.
$limit & $skip: Membatasi jumlah hasil yang dikembalikan dan melewati sejumlah dokumen.

Contoh Penggunaan Aggregation Pipeline

Misalkan kita memiliki koleksi orders dan ingin mengetahui total pendapatan per bulan:

{
  "_id": ObjectId("60a7f9b8a7d8f3e8a3a3e3e9"),
  "customer": "John Doe",
  "amount": 150000,
  "date": ISODate("2024-02-01T10:00:00Z")
}

Query menggunakan Aggregation Pipeline:

db.orders.aggregate([
  {
    $group: {
      _id: { $month: "$date" },
      totalRevenue: { $sum: "$amount" }
    }
  },
  {
    $sort: { _id: 1 }
  }
]);

Hasilnya akan menampilkan total pendapatan yang dikelompokkan berdasarkan bulan.

2. Menggunakan Indexing untuk Performa Optimal

Apa Itu Indexing?

Index adalah struktur data yang meningkatkan kecepatan pencarian dokumen dalam koleksi MongoDB. Tanpa index, MongoDB harus melakukan full collection scan, yang sangat lambat untuk dataset besar.

Baca juga: Bagaimana Cara Indexing dan Caching untuk Backend Developer

Jenis-Jenis Index di MongoDB

Single Field Index: Index pada satu field (misalnya username atau email).
Compound Index: Index pada beberapa field sekaligus (misalnya first_name dan last_name).
Text Index: Digunakan untuk pencarian teks penuh.
TTL (Time-To-Live) Index: Menghapus dokumen setelah waktu tertentu.
Geospatial Index: Digunakan untuk pencarian lokasi.

Contoh Penggunaan Index

Misalkan kita sering mencari pengguna berdasarkan email, kita dapat menambahkan index pada field tersebut:

db.users.createIndex({ email: 1 });

Untuk melihat efektivitas index, kita bisa menggunakan explain():

db.users.find({ email: "john@example.com" }).explain("executionStats");

Jika index digunakan, hasilnya akan menunjukkan IXSCAN sebagai metode pemindaian, bukan COLLSCAN.

3. Menggabungkan Aggregation dan Indexing

Aggregation Pipeline bekerja lebih cepat jika query-nya memanfaatkan index. Berikut adalah beberapa tips untuk mengoptimalkan pipeline dengan index:

Gunakan $match di awal untuk memfilter data dengan index sebelum proses agregasi.
Pastikan field yang sering digunakan dalam pencarian memiliki index.
Hindari $project yang menghilangkan field yang diindeks, karena bisa mengurangi efektivitas index.
Gunakan $sort pada field yang diindeks untuk meningkatkan performa sorting.

Contoh query yang dioptimalkan dengan index:

db.orders.aggregate([
  {
    $match: { customer: "John Doe" }
  },
  {
    $group: {
      _id: "$customer",
      totalSpent: { $sum: "$amount" }
    }
  }
]);

Jika kita sudah membuat index pada customer, MongoDB akan lebih cepat dalam mengeksekusi query ini.

Kesimpulan

Optimasi query MongoDB sangat penting untuk meningkatkan performa aplikasi, terutama saat menangani data dalam jumlah besar. Dengan Aggregation Pipeline, kita bisa melakukan pemrosesan data secara efisien, sementara Indexing membantu mempercepat pencarian dokumen. Menggabungkan kedua teknik ini akan memastikan bahwa aplikasi tetap responsif dan hemat sumber daya.