Gw Biarkan AI Agent Ngatur Dev Environment Selama Seminggu

Gw hubungin AI agent ke terminal, file system, dan messaging apps. Dia deploy code, jadwalin task, dan inget apa yang gw bilang bulan lalu. Ini yang beneran terjadi.

22 Mei 20265 min readaitoolingworkflowautomation

Gw udah pake AI coding assistant lumayan lama — Copilot, ChatGPT, yang biasa lah. Berguna, tapi fundamentally terbatas: paste code in, dapet code out, dan context reset tiap kali tutup tab. Mereka ga tau project structure lo. Ga inget preference lo. Ga bisa jalanin apa-apa.

Beberapa bulan lalu gw mulai pake sesuatu yang beda — AI agent yang hidup di terminal dan Telegram, punya persistent memory, dan beneran bisa nge-eksekusi. Bukan chatbot yang suggest code. Agent yang jalanin command, baca file, schedule jobs, deploy ke production, dan inget yang gw bilang tiga sesi lalu.

Kedengeran overkill. Ternyata jadi tool change paling productive yang gw bikin tahun ini.

Apa yang beneran dia lakuin

Agent-nya (Hermes, kalau mau cari) jalan sebagai CLI process yang connect ke Telegram gw. Gw kirim pesan kayak "audit portfolio project dan kasih saran improvement," dan dia clone repo, baca source file, cek setiap URL di project data ke server live, identifikasi deskripsi placeholder dan tech stack yang copy-paste, dan tulis analisis terstruktur.

Itu versi simpelnya. Ini yang menarik:

Dia inget. Punya persistent memory lintas sesi. Gw bilang sekali kalau portfolio gw pake Next.js 13.5.3 dan deploy ke Vercel. Tiga minggu kemudian, gw nanya soal upgrade Next.js dan dia udah tau versi, deploy target, dan constraint gw. Ga perlu jelasin ulang.
Dia schedule. Gw bisa setup cron job lewat dia. "Cek portfolio site tiap pagi dan kasih tau kalau ada project URL yang down." Dia jalanin pengecekan jam 9 pagi, dan kalau ada yang rusak, gw dapet Telegram. Kalau semua fine, diem.
Dia delegate. Untuk task lebih besar, dia spawn sub-agent yang kerja parallel. "Riset 3 approach terbaik buat nambah search ke blog, dan audit project data file buat entri yang stale" — dia jalanin dua-duanya sekaligus dan merge hasilnya.
Dia punya skills. Seiring waktu gw ajarin prosedur — cara audit portfolio, cara nulis implementation plan, cara struktur PR. Prosedur itu persist sebagai skill yang bisa di-reuse, jadi next time gw minta task serupa, dia ikutin pola yang udah established tanpa gw jelasin ulang.

Hari biasa kayak gimana

Pagi: Gw dapet Telegram. "3 project URL return non-200 status semalam." Satu masalah DNS sementara, satu beneran bermasalah. Gw fix yang beneran pas makan siang.

Sore: Gw lagi kerja fitur baru buat Warkas. Gw message agent: "tambahin stock alert threshold ke inventory module, ikutin pattern yang ada." Dia baca codebase, identifikasi pattern, nulis implementasi, commit, dan push. Gw review diff di GitHub.

Malem: Gw lagi mikirin blog post (yang ini, sebenernya). Gw minta dia draft sesuatu soal AI agent di developer workflow. Dia tarik dari memory soal tools yang gw pake, yang pernah gw komplain, dan yang beneran works. Gw edit draft dan publish.

Ga ada yang magic. Semuanya lebih cepet dari manual.

Bagian yang aneh

Ga semuanya mulus. Ada beneran keanehan:

Memory-nya uncanny. Waktu agent bilang "berdasarkan yang lo bilang di Maret soal deploy pipeline," itu jarring di cara yang berbeda dari Siri inget nama lo. Mungkin karena dia inget substansi, bukan trivia.

Dia bikin mistakes dengan pede. Kayak junior dev yang udah baca docs tapi belum pernah kena batunya. Dia suggest approach yang perfectly reasonable tapi ternyata break sesuatu yang subtle. Lo tetep perlu review.

Lo develop insting delegasi. Setelah beberapa waktu lo mulai kategorisasi task: "ini gw kerjain sendiri, ini gw serahin." Mental model yang sama kayak manage team, kecuali team member ga pernah tidur dan kerja secepat API call.

Dia ubah apa yang lo coba. Task yang biasanya gw tunda — "harusnya gw audit semua URL project itu," "harusnya gw nulis lebih banyak blog post," "harusnya gw cek apakah SEO metadata konsisten" — gw tinggal minta agent. Activation energy turun mendekati nol.

Yang ga dia replace

Jelas ya ini bukan:

Ga replace pemahaman. Kalau lo ga tau cara kerja deploy pipeline lo, lo ga bisa evaluate apakah saran agent bagus atau engga.
Ga replace judgment. Dia bakal dengan senang hati implementasi apapun yang lo minta, bahkan kalau yang lo minta salah.
Ga replace taste. Blog post yang dia draft perlu editan manusia. Arsitektur yang dia suggest perlu review manusia.

Yang dia replace itu overhead mekanikal. Tari "clone repo, grep pattern, baca lima file, nulis perubahan, commit, push, buka PR." Itu bukan bagian yang susah — tapi selalu jadi bagian yang makan waktu.

Haruskah lo pake AI agent?

Kalau lo solo developer atau di team kecil, dan ngerasa ngabisin lebih banyak waktu di proses daripada produk — mungkin. Tooling-nya masih early, dan ada setup cost beneran. Lo harus konfigurasi, ajarin preference lo, bangun skill library.

Tapi kalau lo tipe orang yang punya 15 side project dan selesai 2, agent yang ngurangi activation energy di bagian boring bisa jadi bedaan antara "harusnya gw nulis blog post itu" dan beneran nulisnya.

Gw nulis post ini. Tapi agent nge-draft versi pertama, cek grammar, dan bakal publish waktu gw bilang go. Ini workflow sekarang. Aneh, dan works.