unSafe.sh - 不安全
我的收藏
今日热榜
公众号文章
导航
Github CVE
Github Tools
编码/解码
文件传输
Twitter Bot
Telegram Bot
Search
Rss
黑夜模式
美团开源LongCat-Audio-Codec,高效语音编解码器助力实时交互落地
语音大语言模型(Speech LLM)想落地,绕不开一个死结:既要快速理解语音里的语义,又要说出自然的音色,还得实时响应。比如智能音箱 “听不懂” 语音,车载助手 “说” 得像机器人,实时翻译延迟卡半...
2025-11-14 00:0:0 | 阅读: 2 |
收藏
|
美团技术团队 - tech.meituan.com
longcat
codec
模型
llm
speech
LongCat-Flash-Omni正式发布并开源:开启全模态实时交互时代
好的,我现在需要帮用户总结一篇关于美团LongCat-Flash-Omni模型的文章,控制在100字以内。首先,我得通读整篇文章,抓住关键点。 文章提到美团发布了LongCat-Flash系列模型,并且现在升级到了LongCat-Flash-Omni。这个模型有几个亮点:全模态覆盖、端到端架构、大参数量高效推理。这些都是技术上的突破。 接下来,文章详细说明了模型的性能,比如在文本、图像、音频、视频等多模态任务中的表现达到了开源的最先进水平(SOTA)。同时,它还解决了行业中的推理延迟问题,支持实时音视频交互。 另外,文章还提到了模型的训练策略和架构设计,以及开源后的使用情况和用户体验。这些信息虽然重要,但可能在总结时可以适当简化。 现在,我需要将这些关键点浓缩到100字以内。要确保涵盖模型名称、主要特点、性能优势以及开源信息。同时,语言要简洁明了,不使用复杂的术语。 最后,检查一下是否符合用户的要求:直接描述内容,不需要特定开头。确保字数控制在范围内,并且信息准确无误。 </think> 美团发布LongCat-Flash-Omni开源大语言模型,支持全模态覆盖与实时音视频交互,在多模态任务中实现毫秒级响应。该模型参数达5600亿,在文本、图像、音频、视频理解及生成等任务中达到开源最先进水平(SOTA),为开发者提供高效技术选择。...
2025-11-3 00:0:0 | 阅读: 11 |
收藏
|
美团技术团队 - tech.meituan.com
longcat
模态
模型
omni
开源
美团 LongCat 团队发布 VitaBench:基于复杂生活场景的交互式 Agent 评测基准
美团LongCat团队发布VitaBench评测基准,基于外卖、餐厅就餐和旅游出行三大生活场景构建交互式环境与跨场景任务。该基准提出三维复杂度框架量化推理、工具使用与交互复杂性,并通过实验揭示现有模型在真实生活应用中的局限性。已全面开源以推动智能体研发与应用。...
2025-11-2 00:0:0 | 阅读: 2 |
收藏
|
美团技术团队 - tech.meituan.com
模型
vitabench
信息
数据
基准
ICCV 2025 | 美团论文精选及多模态推理竞赛冠军方法分享
美团技术团队在ICCV 2025发表5篇论文,并在多模态推理竞赛中获1冠2季军。论文涵盖视频大型语言模型、实时对话生成、多粒度感知框架、文档理解及视觉分割等领域。...
2025-10-27 00:0:0 | 阅读: 4 |
收藏
|
美团技术团队 - tech.meituan.com
模型
数据
模态
qwen2
vl
LongCat-Video 视频生成模型正式发布,探索世界模型的第一步
好的,我现在需要帮用户总结这篇文章的内容,控制在100字以内。首先,我得仔细阅读文章,抓住主要信息。 文章主要讲的是美团技术团队发布的LongCat-Video视频生成模型。这个模型有几个关键点:统一模型架构、支持多种任务、长视频生成能力强、推理效率高。 接下来,我需要把这些要点浓缩成一句话。要确保涵盖模型名称、核心功能、优势以及应用场景。 可能的结构是:美团发布LongCat-Video模型,支持多种视频生成任务,尤其擅长长视频连贯生成,并优化推理效率,助力世界模型构建和自动驾驶等场景。 这样既简洁又全面,符合用户的要求。 </think> 美团技术团队发布LongCat-Video视频生成模型,支持文生、图生及视频续写任务,尤其擅长长视频连贯生成,并通过优化推理效率助力世界模型构建与自动驾驶等场景应用。...
2025-10-27 00:0:0 | 阅读: 1 |
收藏
|
美团技术团队 - tech.meituan.com
模型
longcat
续写
文生
稀疏
从0到1建设美团数据库容量评估系统
美团数据库团队为应对容量评估与变更风险的挑战,建设了一套完整的数据库容量评估系统。该系统通过流量回放、容量上探与容量运营三大核心功能,在隔离的沙盒环境中模拟真实流量进行测试与评估,并提供科学的决策依据。系统支持多种数据库类型扩展,并结合自动化运维能力提升效率。...
2025-10-17 00:0:0 | 阅读: 20 |
收藏
|
美团技术团队 - tech.meituan.com
回放
流量
数据
集群
数据库
可验证过程奖励在提升大模型推理效率中的探索与实践
文章探讨了大规模推理模型在强化学习后生成冗余回复的问题,并提出了一种可验证的过程奖励机制(VSRM),通过奖励有效步骤、惩罚无效步骤来优化推理效率。实验表明,在多个数学任务基准上,VSRM显著减少了输出长度并提升了模型性能。...
2025-10-10 00:0:0 | 阅读: 14 |
收藏
|
美团技术团队 - tech.meituan.com
模型
vsrm
机制
正确率
可验证
LongCat-Flash-Thinking 正式发布,更强、更专业,保持极速!
美团LongCat团队发布新模型LongCat-Flash-Thinking,在逻辑、数学、代码和智能体任务中达到全球开源模型最先进水平。该模型结合深度思考与工具调用能力,并创新性地实现非形式化与形式化推理结合。...
2025-9-22 00:0:0 | 阅读: 4 |
收藏
|
美团技术团队 - tech.meituan.com
longcat
模型
形式化
开源
基准
开源 | InfiniteTalk:无限长虚拟人视频生成的新范式
InfiniteTalk技术解决虚拟人长视频生成的质量退化问题,支持语音驱动图像和视频模式,实现无限时长生成。已在GitHub开源,应用于电商直播、教育、影视等领域。...
2025-9-21 00:0:0 | 阅读: 25 |
收藏
|
美团技术团队 - tech.meituan.com
模型
dubbing
范式
控制
LongCat-Flash:如何使用 SGLang 部署美团 Agentic 模型
美团开源LongCat-Flash智能体模型,采用创新性混合专家模型(MoE)架构,总参数量达5600亿,结合SGLang框架实现系统优化,在智能体任务中表现优异且推理速度快。...
2025-9-11 00:0:0 | 阅读: 12 |
收藏
|
美团技术团队 - tech.meituan.com
longcat
模型
sglang
moe
吞吐
美团正式发布并开源 LongCat-Flash-Chat,动态计算开启高效 AI 时代
LongCat-Flash-Chat 是一个采用 MoE 架构的 560B 参数大模型,在智能体任务和复杂推理中表现优异。其创新机制实现高效算力分配,并在多项基准测试中取得领先成绩。模型支持快速部署,在 H800 上可实现 100+ tokens/s 的推理速度。现已开源并提供详细部署指导。...
2025-9-1 00:0:0 | 阅读: 13 |
收藏
|
美团技术团队 - tech.meituan.com
longcat
模型
基准
指令
位列
美团 M17 团队开源 Meeseeks 评测集:揭秘大模型的“听话”能力
美团M17团队推出Meeseeks评测基准,专注于评估大模型的指令遵循能力。测试结果显示OpenAI o3-mini表现最优,Claude紧随其后。评测采用三级框架与多轮纠错模式,强调客观性与细致性。该基准已上线魔搭社区等平台,并计划推出多语言版本以支持更广泛应用。...
2025-8-29 00:0:0 | 阅读: 5 |
收藏
|
美团技术团队 - tech.meituan.com
模型
指令
meeseeks
纠错
rllms
可信实验白皮书系列08:开放式分析引擎 | 附PDF合集
美团开发了AB实验分析引擎BETA,支持随机对照、准实验等多种方法和小样本解决方案。该引擎设计高效、易用,并支持分布式计算和多种接入方式。...
2025-8-22 00:0:0 | 阅读: 41 |
收藏
|
美团技术团队 - tech.meituan.com
数据
履约
对照
可信
美团智能头盔研发实践系列01:硬件设计篇
美团推出智能头盔专为外卖骑手设计,集成语音交互与实时感知功能,并采用轻量化设计与多孔道通风系统提升佩戴舒适度与续航能力。具备IPX6级防水性能及主动安全预警系统,在全国推广并获骑手高度评价。...
2025-8-15 00:0:0 | 阅读: 18 |
收藏
|
美团技术团队 - tech.meituan.com
头盔
骑手
安全
模组
配送
美团智能头盔研发实践系列02:软件功能篇
美团智能头盔为外卖骑手提供主动与被动安全功能,包括通话降噪、语音助手、物理防护及摔倒监控,旨在提升配送效率与安全性,并计划未来升级为多模态大模型入口。...
2025-8-15 00:0:0 | 阅读: 17 |
收藏
|
美团技术团队 - tech.meituan.com
骑手
安全
头盔
骑行
风险
联合营销生态下的广告机制设计与实践
美团推出联合营销模式,允许品牌商和零售商共同出资投放广告,提升资源利用率和多方收益。通过创新设计的集资拍卖机制及系列算法优化广告分配与扣费,在实际应用中显著提升了广告效率及平台收入。...
2025-8-8 00:0:0 | 阅读: 33 |
收藏
|
美团技术团队 - tech.meituan.com
拍卖
集资
机制
流量
网络
ACL 2025 | 美团技术团队论文精选
本文介绍了美团技术团队在国际顶会ACL 2025中发表的8篇论文,研究方向覆盖了生成式检索算法、多目标偏好对齐训练、富文本图像理解、搜索词推荐、跨语言迁移能力、多模态数学推理、第三人称任务等技术领域,...
2025-8-1 00:0:0 | 阅读: 10 |
收藏
|
美团技术团队 - tech.meituan.com
模型
数据
信息
switching
模态
美团开源OIBench与CoreCodeBench:揭示大模型编程能力的真实水平
文章探讨了大语言模型在编程领域的实际能力与宣传之间的差距,并介绍了OIBench和CoreCodeBench两个新数据集,用于更真实地评估模型的算法推理和工程代码能力。评测结果显示顶尖模型在复杂场景下仍显不足,并为未来技术优化指明方向。...
2025-7-17 00:0:0 | 阅读: 2 |
收藏
|
美团技术团队 - tech.meituan.com
模型
数据
oibench
基准
编程
可信实验白皮书系列07:高阶实验工具
文章讨论了实验中常见的困难与解决方案,包括样本量不足、多重比较导致的假阳性问题以及高阶实验工具的应用。通过统合分析整合多城市或多次实验结果,并采用Benjamini-Hochberg方法控制假发现率。此外还探索了序贯分析、异质性因果效应估计、多臂老虎机等高级方法以优化实验设计与效果评估。...
2025-6-26 00:0:0 | 阅读: 4 |
收藏
|
美团技术团队 - tech.meituan.com
加权
统合
方差
实验者
模型
开源 | MeiGen-MultiTalk:基于单张照片实现多人互动演绎
美团推出音频驱动的多人对话视频生成框架MultiTalk,在GitHub开源。该框架采用L-RoPE绑定技术精准解决多音频流与人物错位难题,并创新性地使用局部参数训练和多任务学习策略。只需输入多人音频流、参考图像和文本提示即可生成口型精准同步、肢体自然的交互视频,支持影视制作、直播电商等场景工具升级。...
2025-6-26 00:0:0 | 阅读: 13 |
收藏
|
美团技术团队 - tech.meituan.com
multitalk
模型
数据
rope
指令
Previous
2
3
4
5
6
7
8
9
Next