<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Artificial Intelligence on MuS</title><link>https://www.musnotes.my.id/categories/artificial-intelligence/</link><description>Recent content in Artificial Intelligence on MuS</description><generator>Hugo</generator><language>id-ID</language><lastBuildDate>Tue, 09 Jun 2026 19:20:00 +0700</lastBuildDate><atom:link href="https://www.musnotes.my.id/categories/artificial-intelligence/index.xml" rel="self" type="application/rss+xml"/><item><title>Apa Arti 4B, 8B, dan 70B pada Model AI?</title><link>https://www.musnotes.my.id/digital-garden/musnotes/about-ai/apa-arti-4b-8b-70b-pada-model-ai/</link><pubDate>Tue, 09 Jun 2026 19:20:00 +0700</pubDate><guid>https://www.musnotes.my.id/digital-garden/musnotes/about-ai/apa-arti-4b-8b-70b-pada-model-ai/</guid><description>Catatan singkat tentang arti angka 4B, 8B, dan 70B pada model LLM, serta hubungannya dengan parameter, kebutuhan hardware, dan quantization.</description><content:encoded><![CDATA[<p>Angka seperti <strong>4B</strong>, <strong>8B</strong>, atau <strong>70B</strong> pada LLM menunjukkan jumlah <strong>parameter</strong>.</p>
<p>Huruf <strong>B</strong> berarti <strong>billion</strong>, atau <strong>miliar</strong>.</p>
<p>Angka-angka ini memberikan gambaran kasar tentang kapasitas model. Semakin besar ukuran model, biasanya semakin luas kemampuannya, tetapi juga semakin berat kebutuhan <em>hardware</em>-nya.</p>
<ul>
<li><strong>4B</strong> berarti sekitar <strong>4 miliar parameter</strong></li>
<li><strong>8B</strong> berarti sekitar <strong>8 miliar parameter</strong></li>
<li><strong>70B</strong> berarti sekitar <strong>70 miliar parameter</strong></li>
</ul>
<p>Angka ini sering muncul langsung setelah nama model. Misalnya, <strong>Qwen3 8B</strong> berarti varian Qwen3 dengan sekitar 8 miliar parameter. <strong>Llama 3.1 70B</strong> berarti varian Llama 3.1 dengan sekitar 70 miliar parameter. Sementara <strong>Qwen2-72B</strong> berarti varian Qwen2 dengan sekitar 72 miliar parameter.</p>
<blockquote>
<p>Tanda hubung seperti pada <code>Qwen2-72B</code> atau <code>Llama-70B</code> bukan tanda negatif. Itu hanya pemisah antara nama model dan ukuran dimensinya.</p>
</blockquote>
<div class="mus-divider" aria-hidden="true"><svg viewBox="0 0 100 100" class="mus-symbol" xmlns="http://www.w3.org/2000/svg">
  <circle cx="50" cy="50" r="8" fill="currentColor"/>
  <ellipse cx="50" cy="50" rx="40" ry="25" fill="none" stroke="currentColor" stroke-width="2" transform="rotate(-15 50 50)"/>
  <ellipse cx="50" cy="50" rx="30" ry="45" fill="none" stroke="currentColor" stroke-width="2" transform="rotate(60 50 50)"/>
</svg>
</div>

<h2 id="apa-itu-parameter">Apa Itu Parameter?</h2>
<p>Dalam LLM, <strong>parameter</strong> adalah nilai numerik yang dipelajari oleh model selama proses <em>training</em>.</p>
<p>Parameter bukan “fakta” yang disimpan satu per satu seperti isi kamus. Ia lebih mirip jaringan bobot matematis yang membantu model memperkirakan token berikutnya berdasarkan pola yang sudah dipelajari.</p>
<p>Secara umum, semakin banyak jumlah parameter, semakin besar kapasitas model untuk menangkap pola bahasa, instruksi, pengetahuan, dan hubungan antar-konsep.</p>
<p>Namun, ukuran model bukan satu-satunya penentu kualitas. Data <em>training</em>, arsitektur, proses <em>fine-tuning</em>, <em>alignment</em>, <em>context length</em>, dan cara model dijalankan juga sangat berpengaruh.</p>
<div class="mus-divider" aria-hidden="true"><svg viewBox="0 0 100 100" class="mus-symbol" xmlns="http://www.w3.org/2000/svg">
  <circle cx="50" cy="50" r="8" fill="currentColor"/>
  <ellipse cx="50" cy="50" rx="40" ry="25" fill="none" stroke="currentColor" stroke-width="2" transform="rotate(-15 50 50)"/>
  <ellipse cx="50" cy="50" rx="30" ry="45" fill="none" stroke="currentColor" stroke-width="2" transform="rotate(60 50 50)"/>
</svg>
</div>

<h2 id="perbandingan-ukuran-model">Perbandingan Ukuran Model</h2>
<div class="table-wrapper">
  <table>
    <thead>
      <tr>
        <th>Ukuran</th>
        <th>Karakter Umum</th>
        <th>Kebutuhan Lokal</th>
        <th>Contoh Model</th>
      </tr>
    </thead>
    <tbody>
      <tr>
        <td><code>1B-4B</code></td>
        <td>Ringan, cepat, cocok untuk tugas sederhana.</td>
        <td>Bisa berjalan di laptop biasa, terutama jika sudah di-quantize.</td>
        <td>Gemma 2B, Qwen 4B</td>
      </tr>
      <tr>
        <td><code>7B-8B</code></td>
        <td>Sering menjadi titik seimbang (*sweet spot*) untuk pengguna lokal.</td>
        <td>Masih realistis untuk PC atau laptop yang cukup kuat, terutama dalam format Q4 atau Q5.</td>
        <td>Llama 3 8B, Qwen3 8B, Mistral 7B</td>
      </tr>
      <tr>
        <td><code>13B-34B</code></td>
        <td>Lebih kuat untuk instruksi dan reasoning, tetapi mulai terasa berat.</td>
        <td>Membutuhkan RAM/VRAM lebih besar dan biasanya lebih lambat di perangkat biasa.</td>
        <td>Qwen 32B, Yi 34B</td>
      </tr>
      <tr>
        <td><code>70B+</code></td>
        <td>Kapasitas tinggi, terbaik untuk tugas kompleks, tetapi sangat rakus sumber daya.</td>
        <td>Biasanya membutuhkan GPU besar, banyak RAM/VRAM, atau teknik optimasi seperti quantization dan offloading.</td>
        <td>Llama 3.1 70B, Qwen2-72B</td>
      </tr>
    </tbody>
  </table>
</div>
<p>Tabel ini hanya gambaran praktis. Dua model dengan jumlah parameter yang sama belum tentu memiliki kualitas yang identik.</p>
<p>Model 8B yang dilatih dengan data berkualitas tinggi bisa terasa lebih berguna daripada model yang lebih besar namun proses <em>training</em> atau <em>tuning</em>-nya kurang optimal untuk tugas tertentu.</p>
<div class="mus-divider" aria-hidden="true"><svg viewBox="0 0 100 100" class="mus-symbol" xmlns="http://www.w3.org/2000/svg">
  <circle cx="50" cy="50" r="8" fill="currentColor"/>
  <ellipse cx="50" cy="50" rx="40" ry="25" fill="none" stroke="currentColor" stroke-width="2" transform="rotate(-15 50 50)"/>
  <ellipse cx="50" cy="50" rx="30" ry="45" fill="none" stroke="currentColor" stroke-width="2" transform="rotate(60 50 50)"/>
</svg>
</div>

<h2 id="mengapa-ukuran-model-penting-untuk-local-llm">Mengapa Ukuran Model Penting untuk Local LLM?</h2>
<p>Ukuran model penting karena berpengaruh langsung pada kebutuhan <em>hardware</em>.</p>
<p>Model kecil seperti 4B atau 8B biasanya lebih ramah untuk dijalankan secara lokal. Karakteristiknya lebih cepat, hemat memori, dan cocok untuk laptop atau PC standar.</p>
<p>Model besar seperti 70B memiliki kemampuan reasoning yang jauh lebih kuat untuk instruksi kompleks dan tulisan panjang. Namun, konsekuensinya jelas: model menjadi lebih lambat dan membutuhkan memori yang masif.</p>
<p>Dengan kata lain, pengguna <em>local</em> LLM selalu berhadapan dengan <em>trade-off</em> antara:</p>
<ul>
<li>Kualitas output</li>
<li>Kecepatan respons (tokens per second)</li>
<li>Kebutuhan RAM atau VRAM</li>
<li>Ukuran file model</li>
<li>Suhu laptop yang mulai terdengar seperti mesin espresso kecil</li>
</ul>
<div class="mus-divider" aria-hidden="true"><svg viewBox="0 0 100 100" class="mus-symbol" xmlns="http://www.w3.org/2000/svg">
  <circle cx="50" cy="50" r="8" fill="currentColor"/>
  <ellipse cx="50" cy="50" rx="40" ry="25" fill="none" stroke="currentColor" stroke-width="2" transform="rotate(-15 50 50)"/>
  <ellipse cx="50" cy="50" rx="30" ry="45" fill="none" stroke="currentColor" stroke-width="2" transform="rotate(60 50 50)"/>
</svg>
</div>

<h2 id="apa-itu-quantization">Apa Itu Quantization?</h2>
<p><strong>Quantization</strong> adalah teknik untuk mengurangi presisi angka dalam parameter model.</p>
<p>Model asli sering kali disimpan dalam presisi tinggi, misalnya FP16 (16-bit). Pada model besar, hal ini membuat ukuran file dan kebutuhan memori menjadi raksasa.</p>
<p>Melalui <em>quantization</em>, angka-angka tersebut dikompresi ke presisi yang lebih rendah, seperti 8-bit, 5-bit, atau 4-bit. Hasilnya, model menjadi jauh lebih ringan dan bisa masuk ke perangkat lokal.</p>
<p>Contohnya, model 70B dalam format FP16 membutuhkan memori sekitar 140 GB. Setelah di-quantize ke format 4-bit (Q4), kebutuhan memorinya turun drastis ke kisaran 40–45 GB saja.</p>
<blockquote>
<p>Catatan: Estimasi kebutuhan memori model lokal dapat berubah tergantung format quantization, context length, backend, dan konfigurasi offload CPU/GPU. Angka di atas sebaiknya dibaca sebagai perkiraan praktis, bukan aturan absolut.</p>
</blockquote>
<p>Tetapi <em>quantization</em> bukan sihir gratis. Semakin agresif kompresinya, semakin besar kemungkinan terjadi penurunan kualitas (<em>perplexity</em>) pada output model.</p>
<div class="mus-divider" aria-hidden="true"><svg viewBox="0 0 100 100" class="mus-symbol" xmlns="http://www.w3.org/2000/svg">
  <circle cx="50" cy="50" r="8" fill="currentColor"/>
  <ellipse cx="50" cy="50" rx="40" ry="25" fill="none" stroke="currentColor" stroke-width="2" transform="rotate(-15 50 50)"/>
  <ellipse cx="50" cy="50" rx="30" ry="45" fill="none" stroke="currentColor" stroke-width="2" transform="rotate(60 50 50)"/>
</svg>
</div>

<h2 id="kesimpulan">Kesimpulan</h2>
<p>Angka seperti <strong>4B</strong>, <strong>8B</strong>, dan <strong>70B</strong> menunjukkan jumlah parameter yang menjadi tolok ukur kapasitas sebuah model LLM. Semakin besar angkanya, semakin pintar modelnya, tetapi semakin tinggi pula spesifikasi komputer yang diminta.</p>
<p>Sementara itu, <strong>quantization</strong> adalah solusi cerdas untuk memangkas ukuran model tersebut agar lebih bersahabat dengan perangkat harian kita.</p>
<p>Singkatnya:</p>
<blockquote>
<p>Jumlah parameter menentukan seberapa besar kapasitas otak modelnya, sedangkan quantization menentukan seberapa ringan model itu saat dijalankan.</p>
</blockquote>
<p>Untuk kebanyakan pengguna lokal, model <strong>7B–8B</strong> adalah titik tengah yang paling ideal. Sudah cukup cerdas untuk menemani <em>chat</em>, belajar, <em>coding</em> ringan, hingga eksplorasi harian tanpa harus memaksa kamu membeli <em>hardware</em> kelas naga server.</p>
<div class="mus-divider" aria-hidden="true"><svg viewBox="0 0 100 100" class="mus-symbol" xmlns="http://www.w3.org/2000/svg">
  <circle cx="50" cy="50" r="8" fill="currentColor"/>
  <ellipse cx="50" cy="50" rx="40" ry="25" fill="none" stroke="currentColor" stroke-width="2" transform="rotate(-15 50 50)"/>
  <ellipse cx="50" cy="50" rx="30" ry="45" fill="none" stroke="currentColor" stroke-width="2" transform="rotate(60 50 50)"/>
</svg>
</div>

<h2 id="referensi">Referensi</h2>
<ul>
<li>
<p>Local AI Zone. (2025). <em>LLM Model Parameters 2025: Master 7B, 13B, 70B Parameter Selection &amp; Performance Optimization</em>. <a href="https://local-ai-zone.github.io/guides/what-is-ai-model-3b-7b-30b-parameters-guide-2025.html">Local AI Zone</a></p>
</li>
<li>
<p>Meta. (2024). <em>Llama 3.1 Model Card</em>. <a href="https://www.llama.com/docs/model-cards-and-prompt-formats/llama3_1/">Meta Llama</a></p>
</li>
<li>
<p>Meta Llama. (2024). <em>Llama 3.1 70B Model Card on Hugging Face</em>. <a href="https://huggingface.co/meta-llama/Llama-3.1-70B">Hugging Face</a></p>
</li>
<li>
<p>Qwen. (2024). <em>Qwen2-72B Model Card on Hugging Face</em>. <a href="https://huggingface.co/Qwen/Qwen2-72B">Hugging Face</a></p>
</li>
<li>
<p>Dettmers, T., &amp; Zettlemoyer, L. (2022). <em>The case for 4-bit precision: k-bit Inference Scaling Laws</em>. <a href="https://arxiv.org/abs/2212.09720">arXiv</a></p>
</li>
</ul>
]]></content:encoded></item><item><title>Mengapa Kita Terobsesi Menanyakan “Apakah Ini AI?”</title><link>https://www.musnotes.my.id/digital-garden/silva-nigra/neural-gaps/notes-on-doubt/apakah-ai/</link><pubDate>Sun, 31 May 2026 00:00:00 +0700</pubDate><guid>https://www.musnotes.my.id/digital-garden/silva-nigra/neural-gaps/notes-on-doubt/apakah-ai/</guid><description>&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;Peringatan:&lt;/strong&gt; Jika setelah selesai membaca esai ini pikiran pertamamu adalah “Ini pasti ditulis AI”, maka tulisan ini memang sedang membicarakanmu.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;Ketika aku scroll konten di internet akhir-akhir ini, pertanyaan yang paling sering muncul di komentar bukanlah “Apa yang mungkin senimannya rasakan?”, melainkan pertanyaan yang jauh lebih keren, dari sudut pandang yang berkomentar, (mungkin):&lt;/p&gt;
&lt;p&gt;“Apakah ini AI?”&lt;/p&gt;
&lt;p&gt;Lucu sekali, bukan?&lt;/p&gt;
&lt;p&gt;Atau menyedihkan?&lt;/p&gt;
&lt;p&gt;Bayangkan seseorang memainkan piano dengan begitu indah hingga membuatmu terdiam.&lt;/p&gt;</description><content:encoded><![CDATA[<blockquote>
<p><strong>Peringatan:</strong> Jika setelah selesai membaca esai ini pikiran pertamamu adalah “Ini pasti ditulis AI”, maka tulisan ini memang sedang membicarakanmu.</p>
</blockquote>
<p>Ketika aku scroll konten di internet akhir-akhir ini, pertanyaan yang paling sering muncul di komentar bukanlah “Apa yang mungkin senimannya rasakan?”, melainkan pertanyaan yang jauh lebih keren, dari sudut pandang yang berkomentar, (mungkin):</p>
<p>“Apakah ini AI?”</p>
<p>Lucu sekali, bukan?</p>
<p>Atau menyedihkan?</p>
<p>Bayangkan seseorang memainkan piano dengan begitu indah hingga membuatmu terdiam.</p>
<p>Apakah reaksi pertamamu adalah menikmati harmoni dan emosi yang muncul? Atau justru bertanya-tanya apakah jari-jari itu milik manusia atau bukan?</p>
<p>Aku curiga kita sebenarnya tidak benar-benar menghargai karya.</p>
<p>Kita menghargai manusia di balik karya tersebut.</p>
<p>Atau lebih tepatnya: kita menghargai mitos tentang penderitaan, perjuangan, dan keistimewaan manusia.</p>
<p>Apakah sebuah karya menjadi lebih berharga karena dibuat oleh seseorang yang menderita berat? Apakah nilai seni harus diukur dari seberapa besar penderitaan pembuatnya? Atau kita bisa, sekali saja, menghargai sebuah karya semata karena ia mampu menyentuh kita, terlepas dari apakah ia lahir dari darah, keringat, atau algoritma?</p>
<p>Aku tahu, pertanyaan ini terdengar angkuh.</p>
<p>Tapi izinkan aku lebih angkuh lagi untuk sesaat.</p>
<div class="mus-divider" aria-hidden="true"><svg viewBox="0 0 100 100" class="mus-symbol" xmlns="http://www.w3.org/2000/svg">
  <circle cx="50" cy="50" r="8" fill="currentColor"/>
  <ellipse cx="50" cy="50" rx="40" ry="25" fill="none" stroke="currentColor" stroke-width="2" transform="rotate(-15 50 50)"/>
  <ellipse cx="50" cy="50" rx="30" ry="45" fill="none" stroke="currentColor" stroke-width="2" transform="rotate(60 50 50)"/>
</svg>
</div>

<p>Selama ribuan tahun, kita membangun identitas manusia di atas fondasi-fondasi yang ternyata sangat rapuh.</p>
<p>Bumi bukan pusat semesta.</p>
<p>Manusia bukan makhluk istimewa yang terpisah.</p>
<p>Kesadaran mungkin bukan mukjizat yang terpisah dari materi.</p>
<p>Dan sekarang, kreativitas, mahkota terakhir yang kita banggakan, juga mulai goyah.</p>
<p>Dan kita panik.</p>
<p>Tapi di balik kepanikan itu, ada keraguan.</p>
<p>Bagaimana jika selama ini kita terlalu sombong?</p>
<p>Bagaimana jika “keistimewaan manusia” yang kita pertahankan mati-matian hanyalah ilusi kolektif yang nyaman?</p>
<p>Mungkin pertanyaan “Apakah ini AI?” bukanlah pertanyaan tentang teknologi, etika, atau seni.</p>
<p>Mungkin itu adalah pertanyaan tentang kita.</p>
<p>Tentang betapa takutnya kita kehilangan status istimewa yang selama ini kita anggap hak kita.</p>
<p>Aku sendiri tidak yakin jawabannya.</p>
<p>Kadang aku berharap AI tidak akan pernah bisa benar-benar menggantikan kedalaman manusia.</p>
<p>Kadang aku takut bahwa kita sudah terlalu terlambat menyadari bahwa “kedalaman” itu sendiri mungkin hanyalah cerita yang kita buat-buat.</p>
<p>Dan mungkin, justru keraguan itu yang paling manusiawi.</p>
<div class="mus-divider" aria-hidden="true"><svg viewBox="0 0 100 100" class="mus-symbol" xmlns="http://www.w3.org/2000/svg">
  <circle cx="50" cy="50" r="8" fill="currentColor"/>
  <ellipse cx="50" cy="50" rx="40" ry="25" fill="none" stroke="currentColor" stroke-width="2" transform="rotate(-15 50 50)"/>
  <ellipse cx="50" cy="50" rx="30" ry="45" fill="none" stroke="currentColor" stroke-width="2" transform="rotate(60 50 50)"/>
</svg>
</div>

<div style="max-width: 900px; margin: 0 auto; text-align: center;">
<p><img alt="Hasil AI detector" loading="lazy" src="/images/ai-detector-00.png"></p>
<p style="font-style: italic; font-size: 0.9em; color: #888; margin-top: 10px;">96% AI</p>
</div>
<p>Sepertinya, untuk dianggap manusia oleh mesin, aku harus belajar menjadi lebih primitif. Lebih kasar. Lebih penuh emosi murahan. Lebih “manusiawi” dalam arti yang paling stereotipikal.</p>
<p>Betapa lucunya peradaban kita.</p>
<p>Kita menciptakan mesin yang begitu canggih, tetapi untuk lolos dari deteksi mesin itu sendiri, kita justru harus terdengar lebih bodoh, lebih kasar, dan lebih kacau.</p>
<p>Aku tidak yakin apakah ini kemenangan atau kekalahan.</p>
<p>Yang jelas, ini semakin menegaskan poin esai ini: kita sedang kehilangan kendali atas definisi “manusia” itu sendiri.</p>
]]></content:encoded></item></channel></rss>