Nvidia发布Llama-3.1-Minitron4B小型语言模型

2024-08-21 03:15:22

10

Nvidia推出小型语言模型Llama-3.1-Minitron4B

Llama3的压缩版 - 仅4亿参数

🔍 模型特点

📏 参数规模: 仅4亿参数
🚀 性能: 在某些任务上超越GPT-3.5
💻 硬件要求: 可在单个消费级GPU上运行

🔧 技术细节

🧠 基于Llama 3架构
📊 使用知识蒸馏技术
🔬 采用量化和剪枝技术

🌟 应用场景

📱 移动设备应用
🖥️ 边缘计算设备
🏢 中小企业AI应用

📊 性能对比

扫码查看

AIbase制作

Tags：Llama-3.1-Minitron4B 小型语言模型 Nvidia模型 4亿参数模型 GPT-3.5性能对比知识蒸馏技术量化与剪枝技术边缘计算AI应用