Aplicações

Veja os artigos deste label, com traduções para PT-BR.

Artigos

🚀Aplicações • 169 artigo(s) encontrados

NLP/LLMs • Score 85

ElecTwit: A Framework for Studying Persuasion in Multi-Agent Social Systems

arXiv:2601.00994v1 Announce Type: new Abstract: This paper introduces ElecTwit, a simulation framework designed to study persuasion within multi-agent systems, specifically emulating the interactions on social media platforms during a political election. By grounding our experiments in a realistic environment, we aimed to overcome the limitations of game-based simulations often used in prior research. We observed the comprehensive use of 25 specific persuasion techniques across most tested LLMs, encompassing a wider range than previously reported. The variations in technique usage and overall persuasion output between models highlight how different model architectures and training can impact the dynamics in realistic social simulations. Additionally, we observed unique phenomena such as "kernel of truth" messages and spontaneous developments with an "ink" obsession, where agents collectively demanded written proof. Our study provides a foundation for evaluating persuasive LLM agents in real-world contexts, ensuring alignment and preventing dangerous outcomes.

Fonte: arXiv cs.AI

Artigos

ElecTwit: A Framework for Studying Persuasion in Multi-Agent Social Systems

Regularização de Ações de Ordem Superior em Aprendizado por Reforço Profundo: Do Controle Contínuo à Gestão de Energia em Edifícios

AI Agente para Tomada de Decisão de Risco de Crédito Autônoma, Explicável e em Tempo Real

Simulated Reasoning is Reasoning

A New Benchmark for the Appropriate Evaluation of RTL Code Optimization

Empowering Small Language Models with Factual Hallucination-Aware Reasoning for Financial Classification

KGCE: Knowledge-Augmented Dual-Graph Evaluator for Cross-Platform Educational Agent Benchmarking with Multimodal Language Models

Reinforcement Learning Enhanced Multi-hop Reasoning for Temporal Knowledge Question Answering

CogCanvas: Extração de Artefatos Fundamentados Verbatim para Longas Conversas com LLM

OpenSocInt: A Multi-modal Training Environment for Human-Aware Social Navigation

Um modelo unificado de compreensão e geração multimodal para pesquisa científica interdisciplinar

Toward Auditable Neuro-Symbolic Reasoning in Pathology: SQL as an Explicit Trace of Evidence

OmniNeuro: Um Framework HCI Multimodal para Feedback Explicável de BCI via IA Generativa e Sonificação

Acelerando a Busca em Árvores de Monte-Carlo com Políticas Posteriores Otimizadas

CaveAgent: Transforming LLMs into Stateful Runtime Operators

MindChat: A Privacy-preserving Large Language Model for Mental Health Support

MMP-A*: Multimodal Perception Enhanced Incremental Heuristic Search on Path Planning

Alinhamento de Admissibilidade

CNC-TP: Classifier Nominal Concept Based on Top-Pertinent Attributes

XAI-MeD: Explainable Knowledge Guided Neuro-Symbolic Framework for Domain Generalization and Rare Class Detection in Medical Imaging

Improving Behavioral Alignment in LLM Social Simulations via Context Formation and Navigation

Cultural Encoding in Large Language Models: The Existence Gap in AI-Mediated Brand Discovery

Clinical Knowledge Graph Construction and Evaluation with Multi-LLMs via Retrieval-Augmented Generation

Can Large Language Models Solve Engineering Equations? A Systematic Comparison of Direct Prediction and Solver-Assisted Approaches

Jenius Agent: Towards Experience-Driven Accuracy Optimization in Real-World Scenarios

Yuan3.0 Flash: An Open Multimodal Large Language Model for Enterprise Applications

Structured Decomposition for LLM Reasoning: Cross-Domain Validation and Semantic Web Integration

Logics-STEM: Empowering LLM Reasoning via Failure-Driven Post-Training and Document Knowledge Enhancement

AI Agent Systems: Architectures, Applications, and Evaluation

PsychEval: A Multi-Session and Multi-Therapy Benchmark for High-Realism AI Psychological Counselor

Digital Twin AI: Opportunities and Challenges from Large Language Models to World Models

Bayesian Orchestration of Multi-LLM Agents for Cost-Aware Sequential Decision-Making

MorphAny3D: Unleashing the Power of Structured Latent in 3D Morphing

Métodos Semânticos Podem Aprimorar Táticas em Esportes Coletivos? Uma Metodologia para Futebol com Aplicações Mais Amplas

Detecção Adaptativa de Coordenação Causal para Mídias Sociais: Um Framework Guiado por Memória com Aprendizado Semi-Supervisionado

Avaliação de Detectores de Anomalias para Problemas de Classificação Industrial Altamente Desequilibrados Simulados

Implantações Econômicas Inteligentes de Baixa Altitude da Próxima Geração: A Perspectiva O-RAN

Predição Precoce de Cirrose Hepática com Antecedência de Até Três Anos: Um Estudo de Machine Learning Comparando com o FIB-4

O Transporte Ótimo Pode Melhorar o Aprendizado por Reforço Inverso Federado?

Computação de Reservatório Sequencial para Previsão Espacial e Temporal de Alta Dimensionalidade de Forma Eficiente

Uma Análise Comparativa de Métodos de Machine Learning Interpretabéis

Bandidos Contextuais Aditivos Esparsos: Uma Abordagem Não Paramétrica para Tomada de Decisão Online com Covariáveis de Alta Dimensionalidade

Cadeias Neurais e Sistemas Dinâmicos Discretos

Redes Profundas Aprendem Modelos Hierárquicos Profundos

Um Modelo de Aprendizado Profundo com Atenção Esparsa Integrando Recursos Multimodais Heterogêneos para o Perfil de Gravidade da Doença de Parkinson

Knowledge Distillation for Temporal Knowledge Graph Reasoning with Large Language Models

Rede Neural de Entrada Esparsa usando Regularização Côncava em Grupo

Estimativa de densidade espectral de séries temporais funcionais em grandes domínios usando deep learning

Do Barro ao Código: Raciocínio Tipológico e Material nas Interpretações de IA das Torres de Pombos Iranianas

Mitigando o viés otimista na estimativa e otimização de risco entrópico

Um Modelo de Linguagem Grande Aprimorado por Visão e Conhecimento para Inferência Generalizável do Comportamento de Travessia de Pedestres

Projetando uma Rede de Sensores Ótima Através da Minimização da Perda de Informação

Grande Estudo de Caso Empírico: Go-Explore adaptado para Testes de Red Team de IA

DepFlow: Disentangled Speech Generation to Mitigate Semantic Bias in Depression Detection

Comparative Efficiency Analysis of Lightweight Transformer Models: A Multi-Domain Empirical Benchmark for Enterprise NLP Deployment

Modelos de Linguagem de Grande Escala Ainda Podem Explicar a Si Mesmos? Investigando o Impacto da Quantização nas Autoexplicações

A Language-Agnostic Hierarchical LoRA-MoE Architecture for CTC-based Multilingual ASR

Overlooked Safety Vulnerability in LLMs: Malicious Intelligent Optimization Algorithm Request and its Jailbreak

A Ilusão de Insight em Modelos de Raciocínio

CSSBench: Evaluating the Safety of Lightweight LLMs against Chinese-Specific Adversarial Patterns

Geometry of Reason: Spectral Signatures of Valid Mathematical Reasoning

Mask-Conditioned Voxel Diffusion for Joint Geometry and Color Inpainting

FCMBench: Um Benchmark Multimodal Abrangente de Crédito Financeiro para Aplicações do Mundo Real

Context-Aware Pesticide Recommendation via Few-Shot Pest Recognition for Precision Agriculture

S1-MMAlign: A Large-Scale, Multi-Disciplinary Dataset for Scientific Figure-Text Understanding

Application Research of a Deep Learning Model Integrating CycleGAN and YOLO in PCB Infrared Defect Detection

FaithSCAN: Detecção de Alucinações em Uma Única Passagem Baseada em Modelos para Respostas Visuais de Perguntas Fiéis

NeoVerse: Enhancing 4D World Model with in-the-wild Monocular Videos

SingBAG Pro: Accelerating point cloud-based iterative reconstruction for 3D photoacoustic imaging under arbitrary array

A Cascaded Information Interaction Network for Precise Image Segmentation

Ajuste Fino de Modelos de Linguagem de Grande Escala para Triagem Automatizada de Depressão em Pidgin Nigeriano: Estudo Piloto GENSCORE

A Chain-of-Thought Approach to Semantic Query Categorization in e-Commerce Taxonomies

Boosting Segment Anything Model to Generalize Visually Non-Salient Scenarios

Detecção Humana em Tempo Real para Sequências de Vídeo Capturadas Aéreas via Modelos Profundos

Modelos de Gargalo de Conceito Controláveis

Otimização de Redes Neurais LSTM para Previsão de Vendas no Varejo com Recursos Limitados: Um Estudo de Compressão de Modelo

Robust Uncertainty Quantification for Factual Generation of Large Language Models

Memory Bank Compression for Continual Adaptation of Large Language Models

VisNet: Efficient Person Re-Identification via Alpha-Divergence Loss, Feature Fusion and Dynamic Multi-Task Learning

$eta(3,4)$ 'Atenção' em Agentes Cognitivos: Representações de Conhecimento Sem Ontologia com Semântica Teórica de Promessa