MLOps / Systems

Veja os artigos deste label, com traduções para PT-BR.

Artigos

🛠️MLOps / Systems • 256 artigo(s) encontrados

MLOps/Systems • Score 85

Roteamento Consciente de Energia para Grandes Modelos de Raciocínio

Modelos de raciocínio grandes (LRMs) apresentam custos de energia de inferência heterogêneos, dependendo do modelo utilizado e da quantidade de raciocínio realizada. Para reduzir o consumo de energia, é crucial escolher o LRM adequado e operá-lo de forma eficiente. O desempenho dos sistemas que distribuem tarefas entre diferentes LRMs individuais depende do equilíbrio entre o fornecimento médio de energia e as flutuações estocásticas.

Fonte: arXiv cs.AI

Artigos

Roteamento Consciente de Energia para Grandes Modelos de Raciocínio

AI Agente para Tomada de Decisão de Risco de Crédito Autônoma, Explicável e em Tempo Real

CaveAgent: Transforming LLMs into Stateful Runtime Operators

Temporal Attack Pattern Detection in Multi-Agent AI Workflows: An Open Framework for Training Trace-Based Security Models

A New Benchmark for the Appropriate Evaluation of RTL Code Optimization

Jenius Agent: Towards Experience-Driven Accuracy Optimization in Real-World Scenarios

Digital Twin AI: Opportunities and Challenges from Large Language Models to World Models

MathLedger: Um Substrato de Aprendizado Verificável com Feedback Atestado por Ledger

IA Generativa Nativa em Nuvem para Síntese Automatizada de Planogramas: Uma Abordagem de Modelo de Difusão para Otimização de Varejo em Múltiplas Lojas

Robust Assembly Progress Estimation via Deep Metric Learning

A Cascaded Information Interaction Network for Precise Image Segmentation

A Comprehensive Dataset for Human vs. AI Generated Image Detection

Intelligent Traffic Surveillance for Real-Time Vehicle Detection, License Plate Recognition, and Speed Estimation

FaithSCAN: Detecção de Alucinações em Uma Única Passagem Baseada em Modelos para Respostas Visuais de Perguntas Fiéis

Application Research of a Deep Learning Model Integrating CycleGAN and YOLO in PCB Infrared Defect Detection

Focal-RegionFace: Generating Fine-Grained Multi-attribute Descriptions for Arbitrarily Selected Face Focal Regions

Mortar: Mecânicas em Evolução para Design de Jogos Automático

Spatial4D-Bench: A Versatile 4D Spatial Intelligence Benchmark

Context-Aware Pesticide Recommendation via Few-Shot Pest Recognition for Precision Agriculture

TeleWorld: Towards Dynamic Multimodal Synthesis with a 4D World Model

Controles de Abstenção Explícita para Confiabilidade Previsível em Respostas a Perguntas em Vídeo

RoLID-11K: A Dashcam Dataset for Small-Object Roadside Litter Detection

Geometry of Reason: Spectral Signatures of Valid Mathematical Reasoning

TeleDoCTR: Domain-Specific and Contextual Troubleshooting for Telecommunications

A Coleira Agente: Extraindo Mapas Cognitivos Fuzzy de Feedback Causal com LLMs

StockBot 2.0: Vanilla LSTMs Outperform Transformer-based Forecasting for Stock Prices

Adapting Natural Language Processing Models Across Jurisdictions: A pilot Study in Canadian Cancer Registries

A Language-Agnostic Hierarchical LoRA-MoE Architecture for CTC-based Multilingual ASR

Beyond IVR: Benchmarking Customer Support LLM Agents for Business-Adherence

Comparative Efficiency Analysis of Lightweight Transformer Models: A Multi-Domain Empirical Benchmark for Enterprise NLP Deployment

Rule-Based Approaches to Atomic Sentence Extraction

Pat-DEVAL: Chain-of-Legal-Thought Evaluation for Patent Description

Benchmarking de Métodos de Pré-processamento e Integração em Genômica de Células Únicas

Além de APIs Perfeitas: Uma Avaliação Abrangente de Agentes LLM Sob a Complexidade Real de APIs

Retrieval--Reasoning Processes for Multi-hop Question Answering: A Four-Axis Design Framework and Empirical Trends

Noise-Aware Named Entity Recognition for Historical VET Documents

DepFlow: Disentangled Speech Generation to Mitigate Semantic Bias in Depression Detection

Simulação como Supervisão: Pré-treinamento Mecânico para Descoberta Científica

Correção Residual Segura Inspirada em Causalidade para Séries Temporais Multivariadas

Limite de Largura Infinita de uma Única Camada de Atenção: Análise via Programas Tensor

Mitigando o viés otimista na estimativa e otimização de risco entrópico

Language as Mathematical Structure: Examining Semantic Field Theory Against Language Games

Compressed Map Priors for 3D Perception

From Transformers to LLMs: A Systematic Survey of Efficiency Considerations in NLP

Do Barro ao Código: Raciocínio Tipológico e Material nas Interpretações de IA das Torres de Pombos Iranianas

Rumo a uma Teoria Física da Inteligência

The Role of Mixed-Language Documents for Multilingual Large Language Model Pretraining

Detecção de Descargas de Onda Espigada (SWD) usando 1-dimensional Residual UNet

Integração de Multi-Armed Bandit, Aprendizado Ativo e Computação Distribuída para Otimização Escalável

Avatar Forcing: Geração Interativa de Avatares de Cabeça em Tempo Real para Conversação Natural

From Evidence-Based Medicine to Knowledge Graph: Retrieval-Augmented Generation for Sports Rehabilitation and a Domain Benchmark

FlashInfer-Bench: Construindo o Ciclo Virtuoso para Sistemas LLM Impulsionados por IA

Compreendendo Emoção no Discurso: Insights de Reconhecimento e Padrões Linguísticos para Geração

Talk Less, Verify More: Improving LLM Assistants with Semantic Checks and Execution Feedback

Uma abordagem multi-algoritmo para o balanceamento da carga de trabalho operacional de recursos humanos em um sistema de entrega urbana de última milha

Colocação Ótima de Táxis Consciente do Tráfego Usando Aprendizado por Reforço Baseado em Redes Neurais Gráficas

Knowledge Distillation for Temporal Knowledge Graph Reasoning with Large Language Models

Os Chatbots LLMs Falam Demais? O Benchmark YapBench

JP-TL-Bench: Avaliação Ancorada de LLM em Par para Tradução Bidirecional Japonês-Inglês

Framework Auto-reparador Agente Bio-inspirado para Sistemas de Computação Distribuída Resilientes

Trajectory Guard -- Um Modelo Leve e Consciente de Sequência para Detecção de Anomalias em Tempo Real em AI Agente

Métodos Semânticos Podem Aprimorar Táticas em Esportes Coletivos? Uma Metodologia para Futebol com Aplicações Mais Amplas

Cadeias Neurais e Sistemas Dinâmicos Discretos

Detecção Inteligente de Falhas no Sistema de Energia Elétrica de Nanosatélites

Uma Análise Comparativa de Métodos de Machine Learning Interpretabéis

Dominação Quântica King-Ring no Xadrez: Uma Abordagem QAOA

Computação de Reservatório Sequencial para Previsão Espacial e Temporal de Alta Dimensionalidade de Forma Eficiente

O Transporte Ótimo Pode Melhorar o Aprendizado por Reforço Inverso Federado?

Engenharia de Recursos Híbridos Otimizada para Detecção de Arritmias Eficiente em Recursos em Sinais de ECG: Um Framework de Otimização

Predição Precoce de Cirrose Hepática com Antecedência de Até Três Anos: Um Estudo de Machine Learning Comparando com o FIB-4

IMBWatch -- uma abordagem de Rede Neural Gráfica Espacial-Temporal para detectar Negócios de Massagem Ilícitos

Proteção de Erro Desigual Aprendida por Reforço para Embeddings Semânticos Quantizados

Aprendizado ativo para modelos reduzidos baseados em dados de sistemas diferenciais paramétricos com inferência bayesiana de operadores

Avaliação de Detectores de Anomalias para Problemas de Classificação Industrial Altamente Desequilibrados Simulados

Democratizando Sistemas de IA Eletrônico-Fotônicos: Um Fluxo de Ferramentas de Co-Projeto e Automação de Design Infundido com IA e Código Aberto

Uma Avaliação Empírica de Abordagens Baseadas em LLM para Detecção de Vulnerabilidades de Código: RAG, SFT e Sistemas de Agentes Duplos

Rumo a Sistemas de IA Potencializados por Fotônica em Grande Escala: Da Automação de Design Físico à Coexploração de Sistema e Algoritmo

O Cavalo de Troia no Vocabulário: Sabotagem Sutil da Composição de LLM

Ideação Progressiva usando um Framework de IA Agente para Co-Criação Humano-IA