NLP / LLMs

Veja os artigos deste label, com traduções para PT-BR.

Artigos

🧠NLP / LLMs • 326 artigo(s) encontrados

NLP/LLMs • Score 85

Alinhamento Semântico de Grafos de Conhecimento Multilíngues via Projeções Vetoriais Contextualizadas

O artigo apresenta nosso trabalho em um sistema de alinhamento de ontologias cross-linguais que utiliza correspondência de similaridade coseno baseada em embeddings. As entidades da ontologia são enriquecidas contextualmente por meio de descrições criadas com técnicas inovadoras. Avaliamos nosso trabalho na trilha multifarm OAEI-2022, alcançando 71% de F1 score, indicando a eficácia do nosso pipeline de alinhamento.

Fonte: arXiv cs.AI

Artigos

Alinhamento Semântico de Grafos de Conhecimento Multilíngues via Projeções Vetoriais Contextualizadas

Can Large Language Models Solve Engineering Equations? A Systematic Comparison of Direct Prediction and Solver-Assisted Approaches

COMPASS: A Framework for Evaluating Organization-Specific Policy Alignment in LLMs

Simulated Reasoning is Reasoning

Clinical Knowledge Graph Construction and Evaluation with Multi-LLMs via Retrieval-Augmented Generation

Improving Behavioral Alignment in LLM Social Simulations via Context Formation and Navigation

XAI-MeD: Explainable Knowledge Guided Neuro-Symbolic Framework for Domain Generalization and Rare Class Detection in Medical Imaging

Reading Between the Lines: Deconfounding Causal Estimates using Text Embeddings and Deep Learning

Empowering Small Language Models with Factual Hallucination-Aware Reasoning for Financial Classification

Theory Trace Card: Theory-Driven Socio-Cognitive Evaluation of LLMs

Alinhamento de Admissibilidade

Counterfactual Self-Questioning for Stable Policy Optimization in Language Models

ChaosBench-Logic: A Benchmark for Logical and Symbolic Reasoning on Chaotic Dynamical Systems

Universal Conditional Logic: A Formal Language for Prompt Engineering

MindChat: A Privacy-preserving Large Language Model for Mental Health Support

Can We Trust AI Explanations? Evidence of Systematic Underreporting in Chain-of-Thought Reasoning

Enhancing Temporal Awareness in LLMs for Temporal Point Processes

Cultural Encoding in Large Language Models: The Existence Gap in AI-Mediated Brand Discovery

CogCanvas: Extração de Artefatos Fundamentados Verbatim para Longas Conversas com LLM

Colapso de Contexto: Aprendizado em Contexto e Colapso de Modelo

CaveAgent: Transforming LLMs into Stateful Runtime Operators

Temporal Attack Pattern Detection in Multi-Agent AI Workflows: An Open Framework for Training Trace-Based Security Models

MathLedger: Um Substrato de Aprendizado Verificável com Feedback Atestado por Ledger

Decomposing LLM Self-Correction: The Accuracy-Correction Paradox and Error Depth Hypothesis

Toward Auditable Neuro-Symbolic Reasoning in Pathology: SQL as an Explicit Trace of Evidence

Comentário sobre: Seu Cérebro no ChatGPT: Acumulação de Dívida Cognitiva ao Usar um Assistente de IA para Tarefas de Redação de Ensaios

AI Agente para Tomada de Decisão de Risco de Crédito Autônoma, Explicável e em Tempo Real

ElecTwit: A Framework for Studying Persuasion in Multi-Agent Social Systems

Bayesian Orchestration of Multi-LLM Agents for Cost-Aware Sequential Decision-Making

OpenSocInt: A Multi-modal Training Environment for Human-Aware Social Navigation

Digital Twin AI: Opportunities and Challenges from Large Language Models to World Models

Beyond Gemini-3-Pro: Revisiting LLM Routing and Aggregation at Scale

Aletheia: Quantifying Cognitive Conviction in Reasoning Models via Regularized Inverse Confusion Matrix

AI Agent Systems: Architectures, Applications, and Evaluation

Logics-STEM: Empowering LLM Reasoning via Failure-Driven Post-Training and Document Knowledge Enhancement

Structured Decomposition for LLM Reasoning: Cross-Domain Validation and Semantic Web Integration

Yuan3.0 Flash: An Open Multimodal Large Language Model for Enterprise Applications

Jenius Agent: Towards Experience-Driven Accuracy Optimization in Real-World Scenarios

S1-MMAlign: A Large-Scale, Multi-Disciplinary Dataset for Scientific Figure-Text Understanding

Trajectory Guard -- Um Modelo Leve e Consciente de Sequência para Detecção de Anomalias em Tempo Real em AI Agente

A Chain-of-Thought Approach to Semantic Query Categorization in e-Commerce Taxonomies

Knowledge Distillation for Temporal Knowledge Graph Reasoning with Large Language Models

CPPO: Contrastive Perception for Vision Language Policy Optimization

Focal-RegionFace: Generating Fine-Grained Multi-attribute Descriptions for Arbitrarily Selected Face Focal Regions

Spatial4D-Bench: A Versatile 4D Spatial Intelligence Benchmark

FCMBench: Um Benchmark Multimodal Abrangente de Crédito Financeiro para Aplicações do Mundo Real

IntraStyler: Exemplar-based Style Synthesis for Cross-modality Domain Adaptation

Efficient Prediction of Dense Visual Embeddings via Distillation and RGB-D Transformers

FlashInfer-Bench: Construindo o Ciclo Virtuoso para Sistemas LLM Impulsionados por IA

FreeText: Training-Free Text Rendering in Diffusion Transformers via Attention Localization and Spectral Glyph Injection

Attention to Detail: Global-Local Attention for High-Resolution AI-Generated Image Detection

Controles de Abstenção Explícita para Confiabilidade Previsível em Respostas a Perguntas em Vídeo

ABFR-KAN: Kolmogorov-Arnold Networks for Functional Brain Analysis

RoLID-11K: A Dashcam Dataset for Small-Object Roadside Litter Detection

Geometry of Reason: Spectral Signatures of Valid Mathematical Reasoning

A Coleira Agente: Extraindo Mapas Cognitivos Fuzzy de Feedback Causal com LLMs

Framework Auto-reparador Agente Bio-inspirado para Sistemas de Computação Distribuída Resilientes

Universos Paralelos, Linguagens Paralelas: Um Estudo Abrangente sobre Geração de Exemplos Contrafactuais Multilíngues Baseados em LLM

StockBot 2.0: Vanilla LSTMs Outperform Transformer-based Forecasting for Stock Prices

Agentes Potencializados por LLMs Tendem a Ter Viés Contra Humanos? Explorando a Vulnerabilidade Dependente da Crença

Democratizando Sistemas de IA Eletrônico-Fotônicos: Um Fluxo de Ferramentas de Co-Projeto e Automação de Design Infundido com IA e Código Aberto

Raciocínio em Ação: Recuperação de Conhecimento Orientada por MCTS para Modelos de Linguagem Grandes

Probabilistic Guarantees for Reducing Contextual Hallucinations in LLMs

Os Chatbots LLMs Falam Demais? O Benchmark YapBench

Memory Bank Compression for Continual Adaptation of Large Language Models

Adapting Natural Language Processing Models Across Jurisdictions: A pilot Study in Canadian Cancer Registries

Sigmoid Head for Quality Estimation under Language Ambiguity

CSSBench: Evaluating the Safety of Lightweight LLMs against Chinese-Specific Adversarial Patterns

InfoSynth: Information-Guided Benchmark Synthesis for LLMs

Overlooked Safety Vulnerability in LLMs: Malicious Intelligent Optimization Algorithm Request and its Jailbreak

Fast-weight Product Key Memory

A Language-Agnostic Hierarchical LoRA-MoE Architecture for CTC-based Multilingual ASR

Defensive M2S: Training Guardrail Models on Compressed Multi-turn Conversations

Vision-Language Reasoning for Geolocalization: A Reinforcement Learning Approach

Rumo ao Diagnóstico Diferencial Automatizado de Doenças de Pele Usando Deep Learning e Estratégias Conscientes de Imbalance

Exploring the Performance of Large Language Models on Subjective Span Identification Tasks

Beyond IVR: Benchmarking Customer Support LLM Agents for Business-Adherence

Modelos de Linguagem de Grande Escala Ainda Podem Explicar a Si Mesmos? Investigando o Impacto da Quantização nas Autoexplicações

Comparative Efficiency Analysis of Lightweight Transformer Models: A Multi-Domain Empirical Benchmark for Enterprise NLP Deployment