Privacidade / Segurança / Fairness

Veja os artigos deste label, com traduções para PT-BR.

Artigos

🔐Privacidade / Segurança / Fairness • 141 artigo(s) encontrados

NLP/LLMs • Score 85

Cultural Encoding in Large Language Models: The Existence Gap in AI-Mediated Brand Discovery

arXiv:2601.00869v1 Announce Type: new Abstract: As artificial intelligence systems increasingly mediate consumer information discovery, brands face algorithmic invisibility. This study investigates Cultural Encoding in Large Language Models (LLMs) -- systematic differences in brand recommendations arising from training data composition. Analyzing 1,909 pure-English queries across 6 LLMs (GPT-4o, Claude, Gemini, Qwen3, DeepSeek, Doubao) and 30 brands, we find Chinese LLMs exhibit 30.6 percentage points higher brand mention rates than International LLMs (88.9% vs. 58.3%, p<.001). This disparity persists in identical English queries, indicating training data geography -- not language -- drives the effect. We introduce the Existence Gap: brands absent from LLM training corpora lack "existence" in AI responses regardless of quality. Through a case study of Zhizibianjie (OmniEdge), a collaboration platform with 65.6% mention rate in Chinese LLMs but 0% in International models (p<.001), we demonstrate how Linguistic Boundary Barriers create invisible market entry obstacles. Theoretically, we contribute the Data Moat Framework, conceptualizing AI-visible content as a VRIN strategic resource. We operationalize Algorithmic Omnipresence -- comprehensive brand visibility across LLM knowledge bases -- as the strategic objective for Generative Engine Optimization (GEO). Managerially, we provide an 18-month roadmap for brands to build Data Moats through semantic coverage, technical depth, and cultural localization. Our findings reveal that in AI-mediated markets, the limits of a brand's "Data Boundaries" define the limits of its "Market Frontiers."

Fonte: arXiv cs.AI

Artigos

Cultural Encoding in Large Language Models: The Existence Gap in AI-Mediated Brand Discovery

Can We Trust AI Explanations? Evidence of Systematic Underreporting in Chain-of-Thought Reasoning

Temporal Attack Pattern Detection in Multi-Agent AI Workflows: An Open Framework for Training Trace-Based Security Models

MathLedger: Um Substrato de Aprendizado Verificável com Feedback Atestado por Ledger

MindChat: A Privacy-preserving Large Language Model for Mental Health Support

COMPASS: A Framework for Evaluating Organization-Specific Policy Alignment in LLMs

FaithSCAN: Detecção de Alucinações em Uma Única Passagem Baseada em Modelos para Respostas Visuais de Perguntas Fiéis

DichroGAN: Towards Restoration of in-air Colours of Seafloor from Satellite Imagery

SV-GS: Sparse View 4D Reconstruction with Skeleton-Driven Gaussian Splatting

ActErase: A Training-Free Paradigm for Precise Concept Erasure via Activation Patching

A Spatially Masked Adaptive Gated Network for multimodal post-flood water extent mapping using SAR and incomplete multispectral data

FCMBench: Um Benchmark Multimodal Abrangente de Crédito Financeiro para Aplicações do Mundo Real

ABFR-KAN: Kolmogorov-Arnold Networks for Functional Brain Analysis

BHaRNet: Reliability-Aware Body-Hand Modality Expertized Networks for Fine-grained Skeleton Action Recognition

HarmoniAD: Harmonizing Local Structures and Global Semantics for Anomaly Detection

Deep Delta Learning

StockBot 2.0: Vanilla LSTMs Outperform Transformer-based Forecasting for Stock Prices

Inferência de Variáveis Instrumentais Não Paramétricas com Muitos Instrumentos Fracos

Adapting Natural Language Processing Models Across Jurisdictions: A pilot Study in Canadian Cancer Registries

CSSBench: Evaluating the Safety of Lightweight LLMs against Chinese-Specific Adversarial Patterns

MotionPhysics: Learnable Motion Distillation for Text-Guided Simulation

Aprendendo a Ser Reproduzível: Design de Função de Perda Personalizada para Redes Neurais Robústas

ECR: Manifold-Guided Semantic Cues for Compact Language Models

Noise-Aware Named Entity Recognition for Historical VET Documents

DepFlow: Disentangled Speech Generation to Mitigate Semantic Bias in Depression Detection

Clustering por Denoising: Difusão latente plug-and-play para dados de célula única

Simulação como Supervisão: Pré-treinamento Mecânico para Descoberta Científica

Grande Estudo de Caso Empírico: Go-Explore adaptado para Testes de Red Team de IA

Mitigando o viés otimista na estimativa e otimização de risco entrópico

Personalização Federada de Grandes Modelos: Abordagens, Experimentos e Insights

Classificação Ajustada por Incerteza para Precificação de Ativos com Machine Learning

Otimização Bi-objetiva Guiada por Interpretabilidade: Alinhando Precisão e Explicabilidade

HFedMoE: Aprendizado Federado Heterogêneo Consciente de Recursos com Mixture-of-Experts

Amostras Adversariais Não São Criadas Iguais

Os Chatbots LLMs Falam Demais? O Benchmark YapBench

Trajectory Guard -- Um Modelo Leve e Consciente de Sequência para Detecção de Anomalias em Tempo Real em AI Agente

Uma Análise Comparativa de Métodos de Machine Learning Interpretabéis

Universos Paralelos, Linguagens Paralelas: Um Estudo Abrangente sobre Geração de Exemplos Contrafactuais Multilíngues Baseados em LLM

Agentes Potencializados por LLMs Tendem a Ter Viés Contra Humanos? Explorando a Vulnerabilidade Dependente da Crença

All-in-One Video Restoration under Smoothly Evolving Unknown Weather Degradations

ReMA: A Training-Free Plug-and-Play Mixing Augmentation for Video Behavior Recognition

O Transporte Ótimo Pode Melhorar o Aprendizado por Reforço Inverso Federado?

Ajuste Fino Robusto de Grafos com Prompting Adversarial de Grafos

Identificação e Estimativa sob Múltiplas Versões de Tratamento: Abordagem Mixture-of-Experts

Reparametrização Categórica com Modelos de Difusão Denoising

Redes de Imputação Condicional Generativa de Valores Ausentes

SSI-GAN: Redes Geradoras Adversariais Semi-Supervisionadas Inspiradas no Swin para Classificação de Espículas Neurais

Robust Uncertainty Quantification for Factual Generation of Large Language Models

DA-DPO: Otimização de Preferências Consciente da Dificuldade e Custo-Eficiente para Reduzir Alucinações em MLLMs

Rumo a Sistemas de IA Potencializados por Fotônica em Grande Escala: Da Automação de Design Físico à Coexploração de Sistema e Algoritmo

SD2AIL: Aprendizado por Imitação Adversarial a partir de Demonstrações Sintéticas via Modelos de Difusão

Contribuição Consciente de Dados via Destilação de Cadeia de Pensamento Orientada pela Comunidade

Grad: Geração de Difusão de Relações Guiadas para Aumento de Grafos na Detecção de Fraude em Grafos

Seleção de Recursos Não Supervisionada via Autoencoder Robusto e Aprendizado Adaptativo de Grafo

Uma Rede Híbrida Indutiva-Transdutiva para Imputação de Fluxo de Tráfego em Locais Não Amostrados

Does It Tie Out? Towards Autonomous Legal Agents in Venture Capital

Garantindo Robustez de Calibração na Predição Conformal Dividida Sob Ataques Adversariais

De Atalho a Cabeça de Indução: Como a Diversidade de Dados Molda a Seleção de Algoritmos em Transformers

A informação mútua normalizada é uma medida enviesada para classificação e detecção de comunidades

De Palavra a Mundo: Podem Modelos de Linguagem Grande Servir como Modelos de Mundo Baseados em Texto Implicitamente?

GeoSense-AI: Fast Location Inference from Crisis Microblogs

Repensando a Inteligência Multi-Agente Através da Lente de Redes de Pequeno Mundo

A Comparative Study of Light-weight Language Models for PII Masking and their Deployment for Real Conversational Texts

NEURO-GUARD: Generalização Neuro-Simbólica e Roteamento Adaptativo Imparcial para Diagnósticos -- IA Médica Explicável

MEEA: Otimização Confrontacional Baseada no Efeito de Exposição Mere para Jailbreaking de LLMs

Podemos Testar Teorias da Consciência em IA? Ablations, Marcadores e Robustez

Geração de Regras Programáticas para Detecção de Falsificação de Documentos Usando Modelos de Linguagem de Grande Escala

EIA-SEC: Framework Melhorado de Actor-Critic para Controle Colaborativo de Multi-UAV na Agricultura Inteligente

Benchmarking de substitutos neurais em fluxos multifísicos espaço-temporais realistas

Inteligência Alinhada à Segurança Embutida via Embeddings de Alinhamento Interno Diferenciáveis

Mapas auto-organizáveis para avaliação da qualidade da água em reservatórios e lagos: Uma revisão sistemática da literatura

Ensinando e Criticando a Conceituação e Operacionalização em NLP

Remedy-R: Generative Reasoning for Machine Translation Evaluation without Error Annotations

FairExpand: Justiça Individual em Grafos com Informações de Similaridade Parcial

Unificando Aprendizado por Reforço Causal: Revisão, Taxonomia, Algoritmos e Aplicações

Inferência Causal como Adaptação de Distribuição: Otimizando o Risco ATE sob Incerteza de Propensão

Deep Learning para Extração do Modo $B$ Primordial

Toward Human-Centered AI-Assisted Terminology Work

Descida de Espelho Variacional Online para Aprendizado Robusto na Ponte de Schrödinger