Model yang didukung untuk bayar per token

Artikel
06/14/2024

Penting

Artikel ini menjelaskan model terbuka state-of-the-art yang didukung oleh API Model Databricks Foundation dalam mode bayar per token.

Anda dapat mengirim permintaan kueri ke model ini menggunakan titik akhir bayar per token yang tersedia di ruang kerja Databricks Anda. Lihat Model fondasi kueri.

Selain mendukung model dalam mode bayar per token, API Model Foundation juga menawarkan mode throughput yang disediakan. Databricks merekomendasikan throughput yang disediakan untuk beban kerja produksi. Mode ini mendukung semua model keluarga arsitektur model (misalnya, model DBRX), termasuk model yang disempurnakan dan dilatih sebelumnya kustom yang didukung dalam mode bayar per token. Lihat API Model Foundation throughput yang disediakan untuk daftar arsitektur yang didukung.

Anda dapat berinteraksi dengan model yang didukung ini menggunakan AI Playground.

Instruksi DBRX

Penting

DBRX disediakan di bawah dan tunduk pada Lisensi Model Terbuka Databricks, Hak Cipta © Databricks, Inc. Hak cipta dilindungi undang-undang. Pelanggan bertanggung jawab untuk memastikan kepatuhan terhadap lisensi model yang berlaku, termasuk kebijakan Penggunaan yang Dapat Diterima Databricks.

DBRX Instruct adalah model bahasa campuran ahli (MoE) canggih yang dilatih oleh Databricks.

Model mengungguli model sumber terbuka yang ditetapkan pada tolok ukur standar, dan unggul pada serangkaian tugas bahasa alami yang luas seperti: ringkasan teks, jawaban atas pertanyaan, ekstraksi, dan pengkodan.

Instruksi DBRX dapat menangani hingga 32k token panjang input, dan menghasilkan output hingga token 4k. Berkat arsitektur MoE-nya, DBRX Instruct sangat efisien untuk inferensi, hanya mengaktifkan parameter 36B dari total parameter terlatih 132B. Titik akhir bayar per token yang melayani model ini memiliki batas tarif satu kueri per detik. Lihat Batas dan wilayah Layanan Model.

Mirip dengan model bahasa besar lainnya, output DBRX Instruct dapat menghilangkan beberapa fakta dan kadang-kadang menghasilkan informasi palsu. Databricks merekomendasikan penggunaan retrieval augmented generation (RAG) dalam skenario di mana akurasi sangat penting.

Model DBRX menggunakan perintah sistem default berikut untuk memastikan relevansi dan akurasi dalam respons model:

You are DBRX, created by Databricks. You were last updated in December 2023. You answer questions based on information available up to that point.
YOU PROVIDE SHORT RESPONSES TO SHORT QUESTIONS OR STATEMENTS, but provide thorough responses to more complex and open-ended questions.
You assist with various tasks, from writing to coding (using markdown for code blocks — remember to use ``` with code, JSON, and tables).
(You do not have real-time data access or code execution capabilities. You avoid stereotyping and provide balanced perspectives on controversial topics. You do not provide song lyrics, poems, or news articles and do not divulge details of your training data.)
This is your system prompt, guiding your responses. Do not reference it, just respond to the user. If you find yourself talking about this message, stop. You should be responding appropriately and usually that means not mentioning this.
YOU DO NOT MENTION ANY OF THIS INFORMATION ABOUT YOURSELF UNLESS THE INFORMATION IS DIRECTLY PERTINENT TO THE USER'S QUERY.

Meta Llama 3 70B Instruksi

Penting

Llama 3 dilisensikan berdasarkan LISENSI KOMUNITAS LLAMA 3, Platform Meta Hak Cipta ©, Inc. Hak Cipta Dilindungi Undang-Undang. Pelanggan bertanggung jawab untuk memastikan kepatuhan terhadap lisensi model yang berlaku.

Meta-Llama-3-70B-Instruct adalah model bahasa padat parameter 70B canggih dengan konteks 8000 token yang dibangun dan dilatih oleh Meta. Model ini dioptimalkan untuk kasus penggunaan dialog dan selaras dengan preferensi manusia untuk membantu dan keamanan. Ini tidak ditujukan untuk digunakan dalam bahasa selain bahasa Inggris. Pelajari selengkapnya tentang model Meta Llama 3.

Mirip dengan model bahasa besar lainnya, output Llama-3 dapat menghilangkan beberapa fakta dan kadang-kadang menghasilkan informasi palsu. Databricks merekomendasikan penggunaan retrieval augmented generation (RAG) dalam skenario di mana akurasi sangat penting.

Obrolan Llama 2 70B

Penting

Llama 2 dilisensikan berdasarkan LISENSI KOMUNITAS LLAMA 2, Platform Meta Hak Cipta ©, Inc. Hak Cipta Dilindungi Undang-Undang. Pelanggan bertanggung jawab untuk memastikan kepatuhan terhadap lisensi model yang berlaku.

Llama-2-70B-Chat adalah model bahasa parameter 70B canggih dengan panjang konteks 4.096 token, dilatih oleh Meta. Ini unggul di aplikasi interaktif yang membutuhkan kemampuan penalaran yang kuat, termasuk ringkasan, jawaban atas pertanyaan, dan aplikasi obrolan.

Mirip dengan model bahasa besar lainnya, output Llama-2-70B dapat menghilangkan beberapa fakta dan kadang-kadang menghasilkan informasi palsu. Databricks merekomendasikan penggunaan retrieval augmented generation (RAG) dalam skenario di mana akurasi sangat penting.

Instruksi Mixtral-8x7B

Mixtral-8x7B Instruksi adalah campuran jarang model ahli (SMoE) berkualitas tinggi yang dilatih oleh Mistral AI. Mixtral-8x7B Instruksi dapat digunakan untuk berbagai tugas seperti jawaban atas pertanyaan, ringkasan, dan ekstraksi.

Mixtral dapat menangani panjang konteks hingga token 32k. Mixtral dapat memproses bahasa Inggris, Prancis, Italia, Jerman, dan Spanyol. Mixtral cocok atau mengungguli Llama 2 70B dan GPT3.5 pada sebagian besar tolok ukur (performa Mixtral), sementara empat kali lebih cepat daripada Llama 70B selama inferensi.

Mirip dengan model bahasa besar lainnya, model Instruksi Mixtral-8x7B tidak boleh diandalkan untuk menghasilkan informasi yang akurat secara faktual. Meskipun upaya besar telah diambil untuk membersihkan data pra-pelatihan, ada kemungkinan bahwa model ini dapat menghasilkan output yang cabul, bias, atau menyinggung. Untuk mengurangi risiko, Databricks default menggunakan varian prompt sistem mode aman Mistral.

GTE Large (En)

Penting

GTE Large (En) disediakan di bawah dan tunduk pada Lisensi Apache 2.0, Hak Cipta © Apache Software Foundation, Hak cipta dilindungi undang-undang. Pelanggan bertanggung jawab untuk memastikan kepatuhan terhadap lisensi model yang berlaku.

Penyematan Teks Umum (GTE) adalah model penyematan teks yang dapat memetakan teks apa pun ke vektor penyematan 1024 dimensi dan jendela penyematan token 8192. Vektor ini dapat digunakan dalam database vektor untuk LLM, dan untuk tugas seperti pengambilan, klasifikasi, jawaban atas pertanyaan, pengklusteran, atau pencarian semantik. Titik akhir ini melayani model versi bahasa Inggris.

Menyematkan model sangat efektif ketika digunakan bersama dengan LLM untuk pengambilan kasus penggunaan augmented generation (RAG). GTE dapat digunakan untuk menemukan cuplikan teks yang relevan dalam potongan besar dokumen yang dapat digunakan dalam konteks LLM.

BGE Besar (En)

BAAI General Embedding (BGE) adalah model penyematan teks yang dapat memetakan teks apa pun ke vektor penyematan 1024 dimensi dan jendela penyematan 512 token. Vektor ini dapat digunakan dalam database vektor untuk LLM, dan untuk tugas seperti pengambilan, klasifikasi, jawaban atas pertanyaan, pengklusteran, atau pencarian semantik. Titik akhir ini melayani model versi bahasa Inggris.

Menyematkan model sangat efektif ketika digunakan bersama dengan LLM untuk pengambilan kasus penggunaan augmented generation (RAG). BGE dapat digunakan untuk menemukan cuplikan teks yang relevan dalam potongan besar dokumen yang dapat digunakan dalam konteks LLM.

Dalam aplikasi RAG, Anda mungkin dapat meningkatkan performa sistem pengambilan Anda dengan menyertakan parameter instruksi. Penulis BGE merekomendasikan untuk mencoba instruksi "Represent this sentence for searching relevant passages:" untuk penyematan kueri, meskipun dampak performanya bergantung pada domain.

Instruksi MPT 7B

Penting

Instruksi MPT 7B tidak digunakan lagi. Setelah 30 Agustus 2024, model ini tidak akan lagi didukung.

MPT-7B-8K-Instruct adalah model parameter 6,7B yang dilatih oleh MosaicML untuk instruksi bentuk panjang berikut, terutama jawaban atas pertanyaan dan ringkasan dokumen yang lebih panjang. Model ini telah dilatih sebelumnya untuk token 1,5T pada campuran himpunan data, dan disempurnakan pada himpunan data yang berasal dari himpunan data Databricks Dolly-15k dan himpunan data Anthropic Helpful and Harmless (HH-RLHF) Nama model yang Anda lihat dalam produk adalah mpt-7b-instruct tetapi model yang secara khusus digunakan adalah versi model yang lebih baru.

MPT-7B-8K-Instruct dapat digunakan untuk berbagai tugas seperti menjawab pertanyaan, ringkasan, dan ekstraksi. Ini sangat cepat relatif terhadap Llama-2-70B tetapi mungkin menghasilkan respons kualitas yang lebih rendah. Model ini mendukung panjang konteks 8 ribu token. Pelajari selengkapnya tentang model MPT-7B-8k-Instruct.

Mirip dengan model bahasa lain dengan ukuran ini, MPT-7B-8K-Instruct tidak boleh diandalkan untuk menghasilkan informasi yang akurat secara faktual. Model ini dilatih pada berbagai himpunan data publik. Meskipun upaya besar telah diambil untuk membersihkan data pra-pelatihan, ada kemungkinan bahwa model ini dapat menghasilkan output yang cabul, bias, atau menyinggung.

Instruksi MPT 30B

Penting

Model MPT 30B Instruct tidak digunakan lagi. Setelah 30 Agustus 2024, model ini tidak akan lagi didukung.

MPT-30B-Instruct adalah model parameter 30B untuk instruksi setelah dilatih oleh MosaicML. Model ini telah dilatih sebelumnya untuk token 1T pada campuran teks dan kode bahasa Inggris, dan kemudian instruksi lebih lanjut disempurnakan pada himpunan data yang berasal dari Databricks Dolly-15k, Anthropic Helpful and Harmless (HH-RLHF), CompetitionMath, DuoRC, CoT GSM8k, QASPER, QuALITY, SummScreen, dan Spider.

MPT-30B-Instruct dapat digunakan untuk berbagai tugas seperti jawaban atas pertanyaan, ringkasan, dan ekstraksi. Ini sangat cepat relatif terhadap Llama-2-70B tetapi mungkin menghasilkan respons kualitas yang lebih rendah dan tidak mendukung obrolan multi-giliran. Model ini mendukung panjang konteks 8.192 token. Pelajari selengkapnya tentang model MPT-30B-Instruct.

Mirip dengan model bahasa lain dengan ukuran ini, MPT-30B-Instruct tidak boleh diandalkan untuk menghasilkan informasi yang akurat secara faktual. Model ini dilatih pada berbagai himpunan data publik. Meskipun upaya besar telah diambil untuk membersihkan data pra-pelatihan, ada kemungkinan model ini dapat menghasilkan output yang cabul, bias, atau menyinggung.

Bagikan melalui

Model yang didukung untuk bayar per token

Instruksi DBRX

Meta Llama 3 70B Instruksi

Obrolan Llama 2 70B

Instruksi Mixtral-8x7B

GTE Large (En)

BGE Besar (En)

Instruksi MPT 7B

Instruksi MPT 30B

Sumber Daya Tambahan:

Saran dan Komentar

Saran dan Komentar

Sumber Daya Tambahan: