首页
学习
活动
专区
圈层
工具
发布

#量化

GGUF、GPTQ、AWQ、EXL2、MLX、VMLX...运行大模型,为什么会有这么多格式?

掘金安东尼

最早的大模型,只存在于超级 GPU 集群里。看 GPT-3、PaLM、Claude,感觉它们像一种遥远的云端能力,离普通开发者很远。你知道它很强,但你并不觉得自...

000

IMA实操技能手册14|用IMA做循证教研,让数据说话

用户12566316

请结合我的知识库中【教师A的《光的折射》录课AI分析报告】与【教师B的《光的折射》录课AI分析报告】,进行对比分析。要求: 从"教学结构""师生话语比变化""...

000

Julia高性能数值计算实战

风骏时光少年

Julia 是专为科学计算、数值分析设计的高性能编程语言,兼顾动态语言的简洁性与编译型语言的运行效率,在矩阵运算、大数据计算、并行任务场景中表现突出。本文结合实...

000

量化软件ptrade使用指南!告别盯盘苦日子,3步把你的“炒股经验”变成Ptrade自动策略,躺着等交易!

用户12567181

你知道吗?根据最新数据,2025年,当前A股市场量化资金规模已超过1.8万亿元,A股市场约30%的交易量来自量化策略。但别被这些数字吓到,因为现在,借助Ptra...

1500

技术债务如何吞噬开发者时间?实证揭秘!

用户10377957

研究通过纵向调查和访谈,量化了『技术债务』对开发时间的浪费,并分析了其具体影响,为『技术债务』管理提供了实证依据。以下是核心内容要点:

5300

十年磨一剑!Apache Hive 性能优化演进全史(2013 - 现在)

PawSQL

参考资料: 本文内容整理自Apache Hive官方Release Notes及相关JIRA任务。

4700

QMT数据下载方式有哪些?

用户12567181

QMT作为本地客户端,历史数据需要下载,当天实时数据可以直接获取。那么QMT支持哪些数据呢?

6510

低显存福音!8G显存可用 阿里Z-Image Turbo FP8 量化模型下载和使用教程 z-Image-Turbo_fp8.safetensors下载 4060笔记本安装Z-Image

代码简单说

标签:Z Image Turbo、AI绘图、FP8量化、国内AI绘图、低显存跑模型、4060 8G 跑图、Stable Diffusion、AI模型下载

21110

Flux2 Klein 闪电急速出图 WebUI整合包体验版下载及使用教程【上篇】(模型与性能解析)

代码简单说

关键词(SEO): Flux2、Flux Klein、AI绘画整合包、WebUI整合包、FP8模型、AI出图速度

7510

whichllm教程:一键找出最适合你电脑的本地大模型

代码简单说

SEO关键词:本地大模型推荐工具、LLM模型选择工具、Qwen模型部署、本地AI模型运行、GPU显卡跑大模型、whichllm教程、AI模型推荐工具、Huggi...

8310

MiMo UltraSpeed 1000TPS体验|在线体验万亿模型极速推理

代码简单说

SEO关键词:MiMo UltraSpeed、1000 TPS、万亿模型推理加速、TileRT、FP4量化、DFlash投机解码、大模型推理性能优化

10210

谷歌发布 Gemma 4 QAT模型:1GB内存运行大模型,端侧AI再进一步

代码简单说

AI大模型、Gemma 4、QAT量化感知训练、端侧AI、本地部署、手机运行大模型、量化模型、Google Gemma、GGUF、Ollama、Transfor...

11210

Gemma4 12B深度实测:12GB显存即可部署,统一多模态编码器表现如何?

代码简单说

SEO关键词:Gemma4 12B、Gemma4本地部署、统一多模态编码器、Gemma4评测、Gemma4量化模型、Llama.cpp部署、千问3.6对比、MT...

21320

本地零成本运行顶级开源模型:Gemma 4 部署全指南

阿特拉斯

通常是量化版本的问题。Q2、Q3 的低位元量化在某些任务上质量下降明显。解决方法是换 Q4_K_M 以上的版本,或者加上 system prompt 来稳定输出...

11110

2026大模型测试:成本与效益的临界点

顾翔

2025年Q3,某头部金融AI平台在上线新一代风控大模型(128B参数、多模态推理)后72小时内触发3起生产级幻觉事件——非敏感信息泄露、监管合规条款误判、实时...

14700

AI 不再一个字一个字蹦了?简单聊聊 DiffusionGemma

做棵大树

你用 ChatGPT、Claude、Gemini 的时候,它们回答问题的方式是一个字一个字往外蹦的。像打字机一样,一个 Token 接一个 Token,从左到右...

8800

我用 WorkBuddy 搭了个短线量化交易助手,全程没写一行代码

用户9338269

A股短线交易有个经典痛点:盘中信息太多、决策太快、情绪太容易上头。各种看盘软件眼花缭乱,但最终该追高的追高、该止损的不止损。

20210
领券