BrowserOS, peramban agen sumber terbuka yang mengotomatiskan web dengan tujuan bersaing dengan Comet dan Atlas.

  • BrowserOS menjalankan agen AI lokal pada cabang Chromium, dengan privasi secara default dan dukungan ekstensi.
  • Gabungkan otomatisasi browser dengan server MCP dan LLM (OpenAI, Anthropic, atau opsi lokal seperti Ollama/LM Studio).
  • Ia mengusulkan visi di mana browser menjadi "kantor" agen yang dapat digunakan kembali untuk tugas nyata dalam aplikasi web perusahaan.
  • Proyek sumber terbuka 100% (AGPL-3.0), komunitas aktif, dan fokus yang jelas: AI praktis di browser, bukan di cloud.

Sistem Operasi Peramban

Jika Anda pernah mendengar tentang BrowserOS dan bertanya-tanya mengapa begitu banyak orang membicarakan "peramban berotak", berikut gambaran lengkapnya. BrowserOS adalah peramban sumber terbuka yang menggabungkan agen AI yang mampu memahami dan menjalankan instruksi dalam bahasa alami.Mengklik, mengetik, dan menjelajah atas nama Anda, menggunakan sesi login dan akses lokal Anda. Semua ini dengan pendekatan privasi bawaan dan tanpa bergantung pada infrastruktur cloud untuk data pribadi Anda.

Proposal ini bukan sekadar ide acak di dunia peramban: BrowserOS lahir sebagai cabang dari Chromium, dengan kompatibilitas untuk ekstensi Chrome Anda dan tujuan yang jelas:menjadi alternatif yang terbuka dan berfokus pada privasi untuk solusi seperti Atlas (ChatGPT)Comet (Perplexity) atau Dia, selain peramban tradisional. Idenya sederhana untuk dijelaskan dan berdampak kuat: Anda menjelaskan tugas dan agen akan menjalankannya dari komputer Anda sendiri, dengan kredensial Anda dan tanpa mengirimkan riwayat Anda ke pihak ketiga.

Apa itu BrowserOS dan apa bedanya?

Intinya, BrowserOS adalah browser yang menjalankan agen AI secara asli.Ini memungkinkan Anda menulis instruksi seolah-olah Anda sedang menjelaskannya kepada rekan kerja, dan sistem akan mengurus pelaksanaan urutan tindakan: membuka halaman, memulai pencarian, mengisi formulir, atau mengekstrak data. Ini bukan asisten eksternal yang "melihat" peramban Anda: agennya ada di dalam BrowserOS itu sendiri.

Karena dibangun di atas Chromium, pengalamannya terasa familiar sejak menit pertamaAntarmuka yang familier, kompatibilitas dengan ekstensi, impor data Chrome, dan adopsi yang hampir instan bagi mereka yang sudah familiar dengan ekosistemnya. Efek "rasa nyaman" ini mengurangi hambatan saat memulai otomatisasi tanpa mengorbankan penggunaan sehari-hari.

Mengapa sekarang: saatnya agen di browser

Dalam beberapa bulan terakhir, alat pemrograman berbantuan AI telah melipatgandakan produktivitas pengembang. Namun, jutaan pekerja pengetahuan masih terjebak dalam tugas browser yang berulang-ulangMenyalin dan menempel, mengisi formulir, mengekspor data dasbor, meluncurkan kampanye, dll. Itu adalah hambatan sehari-hari.

Tim BrowserOS menyarankan bahwa, untuk pertama kalinya sejak zaman Netscape, Kita memiliki kesempatan untuk menata ulang browser untuk pekerjaan nyataJika AI sudah "menulis" keseluruhan proyek, mengapa ia tidak bisa menekan tombol, menavigasi antarmuka web, atau menggabungkan tindakan seperti yang Anda lakukan, tetapi tanpa Anda harus memegang kendali sepanjang waktu?

Masalah yang ditangani BrowserOS

Sebelum BrowserOS, penerapan agen dalam tugas dunia nyata gagal karena alasan yang sangat spesifik. Proyek ini mengidentifikasi tiga kendala utama yang menghalangi adopsi massalnya.terutama di perusahaan:

  • Akses ke sesi yang diautentikasiBanyak solusi agen yang berjalan di mesin jarak jauh dan tidak dapat beroperasi dengan akun asli Anda (Gmail, LinkedIn, perangkat perusahaan). Akibatnya, solusi tersebut kurang efektif dalam tugas-tugas di dunia nyata.
  • Fragmentasi alatBeberapa agen berkomunikasi dengan server MCP, yang lain hanya melakukan otomatisasi web, dan ada pula yang menggabungkan API seperti Zap. Yang hilang adalah "kotak peralatan" terpadu untuk membangun alur yang kompleks.
  • Kotak hitam dan kunciBeberapa peramban populer adalah produk pencarian atau periklanan. Mereka tidak membuka perintah atau cara kerja internal merekaMereka memberi Anda LLM tertentu dan mengarahkan data ke server mereka. Bagi banyak perusahaan, itu jelas tidak.

BrowserOS merespons dari awal: agen di dalam browser Anda, berjalan di komputer AndaDengan menggabungkan MCP dan otomatisasi, dan di bawah filosofi 100% terbuka yang memungkinkan Anda melakukan audit dan forking kapan pun Anda mau, kombinasi ini memecahkan masalah yang selama ini membuat pendelegasian pekerjaan serius ke AI di browser menjadi tidak memungkinkan.

Cara kerja BrowserOS dan langkah pertama

Alirannya langsung: Anda mengunduh dan menginstal BrowserOS seperti browser lainnyaAnda masuk ke situs yang Anda gunakan setiap hari dan, dari sana, menjelaskan tugas dalam bahasa alami. Agen bertindak dalam konteks dunia nyata Anda, dengan izin dan sesi aktif Anda, seolah-olah Anda berada di depan layar.

  1. Unduh dan instal BrowserOS untuk sistem Anda (tersedia untuk macOS, Windows, dan Linux). Jika Anda khawatir tentang instalasi di Linux, tersedia sebagai AppImage. di GitHub.
  2. Impor data Chrome Anda jika Anda tertarik untuk menyimpan bookmark, riwayat, atau pengaturan.
  3. Hubungkan penyedia AI Anda: OpenAIModel antropik atau lokal melalui Ollama/LM Studio, dengan kunci Anda sendiri.
  4. Mulai mengotomatiskan: merumuskan tujuan dalam teks dan membiarkan agen menjalankan langkah-langkah di web.

Anda juga bisa menggabungkan otomatisasi browser dengan server MCP dan panggilan API dalam alur yang sama. Kombinasi ini memungkinkan Anda membangun asisten yang mampu melakukan scraping data, memprosesnya dalam model, dan memperbarui spreadsheet atau alat SaaS, semuanya dirangkai bersama oleh satu agen.

Fitur utama BrowserOS yang membuat perbedaan

  • Membangun agen dalam bahasa alamiKatakan apa yang Anda inginkan, tanpa pemrograman.
  • Kebebasan modelBawa kunci Anda dan beralih antar LLM, atau jalankan model lokal.
  • Ini adalah browser "normal": Basis kromium, Apakah ekstensi Chrome Anda berfungsi?.

Privasi adalah pilar desain: Data, riwayat, dan sesi Anda tetap ada di komputer Anda.Tanpa telemetri invasif atau ketergantungan pada cloud eksternal. Jika diinginkan, Anda dapat bekerja secara eksklusif dengan model lokal dan sepenuhnya mematikan keran.

Dan jika itu belum cukup, Mereka sedang mengerjakan pemblokir iklan bertenaga AI yang menjanjikan untuk mencakup skenario yang lebih kompleks daripada filter statis. Dan, bagi pengembang dan pengguna berpengalaman, tersedia dukungan untuk menggunakan peramban sebagai server MCP, yang mengintegrasikannya dengan alat-alat seperti claude-code o gemini-cli.

Integrasi, MCP dan penggunaan alat eksternal

Salah satu aset terkuatnya adalah BrowserOS dapat beroperasi sebagai server MCPIni berarti bahwa aplikasi lain yang kompatibel dengan protokol (seperti yang disebutkan) claude-code o gemini-cliMereka dapat "berbicara" dengan peramban Anda dan mendelegasikan tugas antarmuka web kepada agen mereka.

Yang menarik adalah orkestrasinya: Anda tidak perlu memilih antara mengotomatiskan browser atau memanggil API.Anda dapat melakukan keduanya dalam resep agen yang sama. Misalnya, mengekstrak data dari portal dengan UI yang kompleks, memprosesnya dengan model, lalu memuat hasilnya ke dalam spreadsheet atau CRM, tanpa perlu mencampur alat secara manual.

Perbandingan cepat dengan Chrome, Brave, Arc/Dia dan Perplexity Comet

Dibandingkan dengan Chrome

Berkat sumber terbuka Chromium, BrowserOS mewarisi fondasinya, tetapi Chrome telah bertahun-tahun tanpa kemajuan AI asli yang besar untuk otomatisasi.Tanpa MCP, tanpa agen lokal, tanpa lapisan orkestrasi terpadu, ia tetap sekadar peramban hebat... tanpa "asisten klik-untuk-Anda".

Menghadapi Keberanian

Berani membuka jalan secara pribadi, tapi Fokus mereka terbagi antara kripto, pencarian, VPN, dan banyak lagi.BrowserOS melakukan hal sendiri: AI di browser dan otomatisasi pekerjaan nyata.

Menghadap Busur/Dia

Banyak orang menghargai usulan Arc, tapi Ia mematikan kodenya dan meninggalkan pengguna dalam ketidakpastian.Di BrowserOS justru sebaliknya: 100% terbuka, dapat diaudit, dapat di-fork, dengan komunitas yang terlibat dan tanpa ketergantungan pada satu penyedia saja.

Menghadapi Komet Kebingungan

Perplexity pada hakikatnya adalah perusahaan pencarian dan periklanan. Sejarah Anda bisa menjadi sebuah produkDi BrowserOS, janjinya jelas: data lokal dan kendali penuh di pihak Anda.

Keamanan, privasi, dan perizinan

Filosofinya adalah "mengutamakan privasi": Anda menggunakan kunci API atau model lokal Anda sendiri dengan Ollama/LM StudioAnda memilih apa yang tersisa dan apa yang tidak ada di perangkat Anda, dan Anda menyimpan riwayat dan sesi di luar jangkauan pihak ketiga.

Pada tingkat hukum dan masyarakat, BrowserOS adalah perangkat lunak bebas yang dilisensikan di bawah AGPL-3.0Anda dapat melihat cara pembuatannya, meninjau perintah sistem, mengusulkan perubahan, melakukan forking proyek, dan berkontribusi. Semua ini dengan semangat "dibuat dengan cinta dari San Francisco" yang diusung oleh para pembuatnya.

Komunitas, tokoh dan momentum proyek

Ketertarikannya terlihat jelas. Aplikasi ini mendapat lebih dari 4,3 ribu bintang di GitHub, 25.000+ unduhan, dan komunitas Discord yang beranggotakan lebih dari seribu orang. orang yang berpartisipasi aktif. Dalam fragmen lain, metrik seperti "6,3 ribu" dan "558" muncul (berkaitan dengan repositori, kemungkinan bintang/pengikut/cabang), menunjukkan tren kenaikan.

Secara teknis, proyek ini menonjol karena fondasinya C++ di atas raksasa Chromium, sebuah perjalanan yang menuntut yang memerlukan banyak kerja keras dan menjaga kompatibilitas dengan perubahan hulu sambil terus berinovasi di lapisan agen.

Kasus penggunaan dan demo

Pikirkan tentang tugas di dunia nyata: Identifikasi profil yang menarik di antara aplikasi LinkedIn Anda dan tambahkan ke Google SheetIsi formulir yang panjang, kumpulkan data dari berbagai situs web, atau siapkan pengarahan awal berisi informasi penting untuk rapat. Anda menjelaskannya dalam teks, dan agen akan menavigasi dan bertindak seperti yang Anda inginkan.

Terdapat materi audiovisual yang menunjukkan konsep tersebut dalam tindakan: demo seperti “HackerNews.top.3.mp4”, “use-browserOS-to-chat.mp4” atau “use-browserOS-to-extract.mp4” Mereka mengajarkan segalanya mulai dari percakapan berbantuan hingga ekstraksi data dalam pengaturan dunia nyata, yang menegaskan bahwa otomatisasi terjadi dalam konteks autentik Anda.

Visi: Browser sebagai "sistem operasi" untuk agen

Perusahaan hidup di browser: Salesforce, SAP, Workday, alat internal… Sejumlah pekerja pengetahuan menghabiskan 60–80% hari mereka di aplikasi webJika agen dapat mengklik dan mengetik seperti manusia, ia dapat mengotomatiskan hampir semua antarmuka, termasuk yang tanpa API.

Visi yang disajikan oleh proyek ini adalah bahwa TI dapat menerapkan "agen karyawan" yang dapat digunakan kembali"Agen pengeluaran" perusahaan, "agen iklan Facebook" yang dibagikan komunitas yang dapat Anda sesuaikan dengan alur kerja Anda, dll. Lebih sedikit tugas mekanis, lebih fokus pada hal yang memberikan nilai tambah.

Siapa di balik BrowserOS

Inti proyek ini dipimpin oleh dua saudara kembar yang memiliki rekam jejak serius di Big Tech. Nikhil telah bekerja di bagian belakang Reels dan umpan Facebook menggunakan C++ dan sistemNithin telah menjadi insinyur pembelajaran mesin (ML) di YouTube, berpartisipasi dalam model rekomendasi (LRM) utama pertama platform tersebut. Kombinasi tersebut level rendah dan lapisan AI memberi mereka kebebasan untuk menangani Chromium dan, pada saat yang sama, membangun "otak agen" di atasnya.

  • Pengalaman dalam C++ dan sistem skala besar: pemeliharaan layanan penting dan berkinerja tinggi.
  • Spesialisasi dalam ML dan sistem rekomendasi: pemahaman mendalam tentang model modern dan penerapannya.

Suara dari masyarakat dan alternatif yang kurang dikenal

Di kalangan pengguna tingkat lanjut ada keinginan untuk mencoba peramban "berbeda" yang berpotensi. Alternatif seperti Wavebox, Ulaa, Arc, Ghost Browser atau Thorium telah diujiZen Browser dipuji karena produktivitasnya (meskipun tidak berbasis Chromium). Pengujian ini menyebutkan bahwa Wavebox sangat komprehensif tetapi bisa membingungkan dan bahwa membuka potensi penuhnya membutuhkan waktu; Ulaa membanggakan privasi tetapi menyertakan terlalu banyak fitur tambahan; Arc telah menuai beragam reaksi; dan Ghost Browser belum sepenuhnya disukai semua orang.

Mengenai Thorium, terdengar bahwa Sangat cepat tetapi dengan beberapa masalah keamanan.Inilah mengapa beberapa orang menundanya. Dan seringkali, rekomendasinya adalah untuk tidak memilih yang paling terkenal karena mereka sudah mencoba sekitar dua puluh, dan tujuannya adalah untuk menemukan barang langka yang menawarkan sesuatu yang benar-benar baru.

Panduan singkat untuk menggunakan agen

Begitu masuk, "momen ajaib" datang saat Anda mendeskripsikan tugas sebenarnya. Alih-alih menanyakan "untuk mencari ini dan itu" dan mengembalikan ringkasan, agen melakukan interaksi di peramban Anda.Jika situs web tidak memiliki API, tidak masalah: ada UI, ada tindakan yang dapat ditiru oleh agen secara akurat.

  1. Jelaskan tujuan AndaMisalnya, mencari kontak tertentu dalam jaringan profesional dan mentransfer informasinya ke spreadsheet.
  2. Konfirmasikan langkah-langkahnya jika agen menyarankannya kepada Anda (berguna untuk mengaudit apa yang akan dia lakukan).
  3. Awasi pertama kali Untuk menyesuaikan perintah atau aturan, lalu gunakan kembali resepnya.

Penggunaan MCP dan kemampuan untuk "menjahit" otomatisasi, API, dan model memungkinkan hal itu satu agen menyelesaikan proses menyeluruh dari awal hingga akhir, sesuatu yang sebelumnya memerlukan menempelkan beberapa alat dengan lakban.

Privasi berdasarkan desain dan kontrol model

Manfaat utamanya adalah kebebasan memilih mesin AI. Anda dapat bekerja dengan OpenAI, Anthropic, atau menyimpan semuanya secara lokal dengan Ollama/LM Studio.Rute disesuaikan berdasarkan biaya, latensi, atau sensitivitas proyek. Mereka yang mengutamakan privasi mutlak memiliki rute lokal 100%.

Selain itu, Proyek ini menerbitkan dan memungkinkan pengeditan perintah sistemHal ini jarang terjadi. Transparansi ini memudahkan penyesuaian perilaku agen dengan organisasi atau kasus spesifik Anda, serta untuk mengaudit cara agen mengambil keputusan.

Langkah-langkah untuk berkontribusi pada proyek BrowserOS

Jika Anda meyakini gagasan tersebut dan ingin membantu, ada beberapa cara untuk mendukungnya. Tinggalkan bintang di GitHub Ini membantu meningkatkan visibilitas; mengunduh dan menggunakannya menyediakan telemetri yang menarik (jika Anda mengaktifkannya) dan umpan balik; dan bergabung dengan Discord memungkinkan Anda untuk mengusulkan, menemukan, dan menguji fitur-fitur baru.

Terakhir, situs web resmi biasanya menampilkan pengingat unduh browser untuk sistem AndaAnda dapat mengimpor data Chrome jika diinginkan dan menghubungkannya ke penyedia AI pilihan Anda. Dari sana, Anda tinggal membuat agen dan membagikan apa yang sesuai untuk Anda.

Melihat gambaran secara keseluruhan, BrowserOS memantapkan dirinya sebagai Peramban sumber terbuka dengan pendekatan yang berfokus pada agen, mengutamakan privasi, berbasis Chromium, dan dengan komunitas yang berkembang.Platform ini menggabungkan kompatibilitas dengan ekstensi, MCP, dukungan untuk model lokal (Ollama/LM Studio), dan komitmen terbuka yang mencakup lisensi AGPL-3.0 dan perintah yang dapat diedit. Tidak seperti Chrome, Brave, Arc/Dia, atau penawaran berbasis iklan dan pencarian lainnya, platform ini bertujuan untuk menghadirkan "keajaiban" AI langsung ke situs tempat Anda bekerja setiap hari. Meskipun masih ada detail yang perlu disempurnakan (seperti pemblokir iklan bertenaga AI yang akan segera hadir, atau masalah instalasi yang terkadang muncul di Windows), kecepatan dan keterlibatan pengguna menunjukkan bahwa proyek ini sedang berkembang, dibangun dengan penuh cinta di San Francisco, dan dengan keinginan untuk mengubah web dari sekadar rangkaian klik menjadi, akhirnya, sebuah platform bagi agen yang bekerja bersama Anda.