ACL Anthology 論文紹介

生成日: 2026-05-24 02:20

# ACL Anthology 論文紹介

Slack で紹介した ACL Anthology 論文の蓄積先。

## Notes

- [[2026-05-05041204-uieprompter-unified-training-free-framework-document-level-information-extraction]]
- [[2026-05-05042552-speechee-xllm25-retrieval-enhanced-few-shot-prompting]]
- [[20260505044017-llmsr-xllm25-empirical-study-llm-structural-reasoning]]
- [[20260505045014-docie-xllm25-in-context-learning-synthetic-demonstrations]]
- [[20260505045625-speechee-xllm25-end-to-end-structured-event-extraction-from-speech]]
- [[20260505050232-zerosemble-zero-shot-document-information-extraction-heterogeneous-llm-ensembles]]
- [[20260505050611-llmsr-xllm25-swrv-empowering-self-verification-of-small-language-models-through-step-wise-reasoning-and-verification]]
- [[20260505080848-language-models-are-universal-embedders]]
- [[20260505102051-transfer-structural-knowledge-synthetic-languages]]
- [[20260505132404-cross-document-event-keyed-summarization]]
- [[20260505162710-llmsr-xllm25-language-model-based-pipeline-for-structured-reasoning-data-construction]]
- [[20260505192957-llm-dependency-parsing-with-in-context-rules]]
- [[20260505223200-can-llms-interpret-and-leverage-structured-linguistic-representations-a-case-study-with-amrs]]
- [[20260506013416-do-we-still-need-human-annotators-prompting-large-language-models-for-aspect-sentiment-quad-prediction]]
- [[20260506043731-typed-rag-type-aware-decomposition-of-non-factoid-questions-for-retrieval-augmented-generation]]
- [[20260506073928-bartabsa-revisiting-bartabsa-with-decoder-llms]]
- [[20260506104209-structure-modeling-approach-for-ud-parsing-of-historical-modern-japanese]]
- [[20260506134438-enhancing-amr-parsing-with-group-relative-policy-optimization]]
- [[20260506164727-llmsr-xllm25-less-is-more-enhancing-structured-multi-agent-reasoning-via-quality-guided-distillation]]
- [[20260506194943-combining-automated-and-manual-data]]
- [[20260506225144-self-contrastive-loop-of-thought-method-for-text-to-sql-based-on-large-language-model]]
- [[20260507015358-seamlessly-integrating-tree-based-positional-embeddings-into-transformer-models-for-source-code-representation]]
- [[20260507045613-detecting-referring-expressions-in-visually-grounded-dialogue-with-autoregressive-language-models]]
- [[20260507075854-from-syntax-to-semantics-evaluating-impact-linguistic-structures-llm-based-information-extraction]]
- [[20260507110131-regular-pattern-sensitive-crfs-for-distant-label-interactions]]
- [[20260507123042-the-distracting-effect-understanding-irrelevant-passages-in-rag]]
- [[20260507153316-be-cautious-when-merging-unfamiliar-llms-phishing-model-capable-stealing-privacy]]
- [[20260507213931-identifying-filled-pauses-in-speech-across-south-and-west-slavic-languages]]
- [[20260508004401-minikv-pushing-the-limits-of-2-bit-kv-cache-via-compression-and-system-co-design-for-efficient-long-context-inference]]
- [[20260508033705-seal-scaling-to-emphasize-attention-for-long-context-retrieval]]
- [[20260508064908-a-reality-check-on-context-utilisation-for-retrieval-augmented-generation]]
- [[20260508095215-teaching-an-old-llm-secure-coding-localized-preference-optimization-on-distilled-preferences]]
- [[20260508124658-searchable-language-documentation-corpora-doreco-meets-teitok]]
- [[20260508125442-longred-mitigating-short-text-degradation-of-long-context-large-language-models-via-restoration-distillation]]
- [[20260508155854-on-the-path-to-make-ukrainian-a-high-resource-language]]
- [[20260508220402-towards-conditioning-clinical-text-generation-for-user-control]]
- [[20260509010628-os-genesis-automating-gui-agent-trajectory-construction-via-reverse-task-synthesis]]
- [[20260509040114-vision-language-models-struggle-to-align-entities-across-modalities]]
- [[20260509040908-strucom-a-novel-dataset-of-structured-code-comments-in-russian]]
- [[20260509101343-assessing-dialect-fairness-and-robustness-of-large-language-models-in-reasoning-tasks]]
- [[20260509131742-ecorag-evidentiality-guided-compression-for-long-context-rag]]
- [[20260509161126-automixer-checkpoint-artifacts-as-automatic-data-mixers]]
- [[20260509162000-learning-to-rewrite-generalized-llm-generated-text-detection]]
- [[20260509192237-s3-semantic-signal-separation]]
- [[20260509222459-clix-cross-lingual-explanations-of-idiomatic-expressions]]
- [[20260510012713-beyond-the-tip-of-efficiency-uncovering-the-submerged-threats-of-jailbreak-attacks-in-small-language-models]]
- [[20260510042917-lexclipr-cross-lingual-paragraph-retrieval-from-legal-judgments]]
- [[20260510073149-focalpo-enhancing-preference-optimizing-by-focusing-on-correct-preference-rankings]]
- [[20260510133604-when-the-dictionary-strikes-back-slovak-migration-location-extraction]]
- [[20260510163823-taz2024full-analysing-german-newspapers-for-gender-bias-and-discrimination-across-decades]]
- [[20260510193356-dialz-a-python-toolkit-for-steering-vectors]]
- [[20260510194048-quantifying-misattribution-unfairness-in-authorship-attribution]]
- [[20260510224256-beyond-the-answer-advancing-multi-hop-qa-with-fine-grained-graph-reasoning-and-evaluation]]
- [[20260511014500-r2d2-remembering-replaying-and-dynamic-decision-making-with-a-reflective-agentic-memory]]
- [[20260511044701-evaluating-robustness-of-llms-to-typographical-noise-in-yoruba-qa]]
- [[20260511074941-finecite-a-novel-approach-for-fine-grained-citation-context-analysis]]
- [[20260511105226-verify-with-caution-the-pitfalls-of-relying-on-imperfect-factuality-metrics]]
- [[20260511135534-can-llms-reliably-simulate-real-students-abilities-in-mathematics-and-reading-comprehension]]
- [[zhu-etal-2026-raffles]]
- [[zhu-etal-2026-rethinking]]
- [[zhu-etal-2026-scone]]
- [[zhu-etal-2026-show]]
- [[zhuang-etal-2026-workforceagent]]
- [[zilio-finatto-2026-exploring]]
- [[znotins-2026-pretraining]]
- [[zou-etal-2026-active]]
- [[zouhar-etal-2026-generating]]
- [[20260511163501-v-alphasocial-benchmark-and-self-reflective-chain-of-thought-generation-for-visual-social-commonsense-reasoning]]
- [[20260512043835-safe-enhancing-mathematical-reasoning-in-large-language-models-via-retrospective-step-aware-formal-verification]]
- [[20260511224127-tokenisation-is-np-complete]]
- [[20260512014427-reledit-evaluating-conceptual-knowledge-editing-in-language-models-via-relational-reasoning]]
- [[20260512044731-assigning-distinct-roles-quantized-low-rank-matrices-weight-decomposition]]
- [[20260512075131-awes-laws-and-flaws-from-todays-llm-research]]
- [[20260512105924-effects-of-automatic-alignment-on-speech-translation-metrics]]
- [[20260512140556-beyond-text-compression-evaluating-tokenizers-across-scales]]
- [[20260512171145-pisco-pretty-simple-compression-for-retrieval-augmented-generation]]
- [[20260512201733-mathagent-leveraging-mixture-of-math-agent-framework-real-world-multimodal-mathematical-error-detection]]
- [[20260513082044-beyond-citations-integrating-finding-based-relations-for-improved-biomedical-article-representations]]
- [[20260513112359-fraud-r1-multi-round-benchmark-assessing-robustness-llm-against-augmented-fraud-phishing-inducements]]
- [[20260513142851-implicit-reasoning-transformers-reasoning-through-shortcuts]]
- [[20260513083127-bitsandbites-at-semeval-2025-task-9-improving-food-hazard-detection]]
- [[20260513113637-scaling-text-rich-image-understanding-code-guided-synthetic-multimodal-data-generation]]
- [[20260513144015-user-side-model-consistency-monitoring-open-source-large-language-models-inference-services]]
- [[20260513174316-calibraeval-calibrating-prediction-distribution-mitigate-selection-bias-llms-as-judges]]
- [[20260513204713-training-long-context-llms-efficiently-via-chunk-wise-optimization]]
- [[20260513235029-lost-in-literalism-how-supervised-training-shapes-translationese-in-llms]]
- [[20260514025358-medec-a-benchmark-for-medical-error-detection-and-correction-in-clinical-notes]]
- [[20260514055734-tracr-injection-distilling-algorithms-into-pre-trained-language-models]]
- [[20260514090123-feat-preference-feedback-dataset-cost-effective-english-ai-tutoring]]
- [[20260514120506-cheap-character-noise-for-ocr-robust-multilingual-embeddings]]
- [[20260514150854-500xcompressor-generalized-prompt-compression-for-large-language-models]]
- [[20260514211326-from-evasion-to-concealment-stealthy-knowledge-unlearning-for-llms]]
- [[20260515001658-interpretable-company-similarity-with-sparse-autoencoders]]
- [[20260515032029-improving-factuality-with-explicit-working-memory]]
- [[20260515062341-expert-effective-and-explainable-evaluation-of-personalized-long-form-text-generation]]
- [[20260515092716-coling-unia-at-scivqa-2025-few-shot-example-retrieval-confidence-informed-ensembling-for-multimodal-large-language-models]]
- [[20260515123020-eliciting-in-context-retrieval-and-reasoning-for-long-context-large-language-models]]
- [[20260515153420-digital-gatekeepers-googles-role-in-curating-hashtags-and-subreddits]]
- [[20260515183807-helpsteer3-human-annotated-feedback-edit-data-inference-time-scaling]]
- [[20260515214216-pvp-image-dataset-personalized-visual-persuasion]]
- [[20260516004547-catching-stray-balls-football-fandom-impact-digital-discourse]]
- [[20260516034926-secque-benchmark-evaluating-real-world-financial-analysis-capabilities]]
- [[20260516065220-synthesizing-and-adapting-error-correction-data-mobile-large-language-model-applications]]
- [[20260516095556-predicting-implicit-arguments-in-procedural-video-instructions]]
- [[20260516130015-did-translation-models-get-more-robust-without-anyone-even-noticing]]
- [[20260516160552-evaluation-attribution-bias-generator-aware-retrieval-augmented-large-language-models]]
- [[20260516190926-metaphor-and-large-language-models-when-surface-features-matter-more-than-deep-understanding]]
- [[20260516221248-beyond-demographics-fine-tuning-large-language-models-to-predict-individuals-subjective-text-perceptions]]
- [[20260517101614-spectral-insights-into-data-oblivious-critical-layers-in-large-language-models]]
- [[20260517132008-toolspectrum-towards-personalized-tool-utilization-for-large-language-models]]
- [[20260517072333-locagent-graph-guided-llm-agents-for-code-localization]]
- [[20260517102715-fedleke-federated-locate-then-edit-knowledge-editing-for-multi-client-collaboration]]
- [[20260517133133-mdbench-synthetic-multi-document-reasoning-benchmark-generated-with-knowledge-guidance]]
- [[20260517163617-enginius-a-bilingual-llm-optimized-for-plant-construction-engineering]]
- [[20260517193916-the-2nd-automated-verification-of-textual-claims-averitec-shared-task-open-weights-reproducible-and-efficient-systems]]
- [[20260517224315-d-gen-automatic-distractor-generation-and-evaluation-for-reliable-assessment-of-generative-models]]
- [[20260518014614-improving-ai-assistants-embedded-in-short-e-learning-courses-with-limited-textual-content]]
- [[20260518044934-repanda-pandas-powered-tabular-verification-and-reasoning]]
- [[20260518165348-factdebug-semeval-2025-task-7-hybrid-retrieval-pipeline-for-previously-fact-checked-claims]]
- [[20260518105642-minielm-lightweight-adaptive-query-rewriting-framework-e-commerce-search-optimization]]
- [[20260518140058-when-should-dense-retrievers-be-updated-gradnormir]]
- [[20260518170527-can-llms-generate-high-quality-test-cases-for-algorithm-problems-testcase-eval]]
- [[20260518201025-inserter-speech-instruction-following-with-unsupervised-interleaved-pre-training]]
- [[20260519081411-crisists-coupling-social-media-textual-data-and-meteorological-time-series-for-urgency-classification]]
- [[20260519021630-tess-2-large-scale-generalist-diffusion-language-model]]
- [[20260519052102-the-silent-saboteur-imperceptible-adversarial-attacks-against-black-box-rag-systems]]
- [[20260519172445-mmlu-cf-a-contamination-free-multi-task-language-understanding-benchmark]]
- [[20260519113029-dast-context-aware-compression-in-llms-via-dynamic-allocation-of-soft-tokens]]
- [[20260519143358-visual-evidence-prompting-mitigates-hallucinations-in-large-vision-language-models]]
- [[20260519221219-evaluating-llms-with-multiple-problems-at-once]]
- [[20260520041556-span-labeling-with-large-language-models-shell-vs-meat]]
- [[20260520102018-pap2pat-benchmarking-outline-guided-long-text-patent-generation-with-patent-paper-pairs]]
- [[20260520162457-cadreview-automatically-reviewing-cad-programs-with-error-detection-and-correction]]
- [[20260520222909-binary-classifier-optimization-for-large-language-model-alignment]]
- [[20260521043246-llm-powered-test-case-generation-for-detecting-bugs-in-plausible-programs]]
- [[20260521103602-promptwizard-optimizing-prompts-via-task-aware-feedback-driven-self-evolution]]
- [[20260521163941-guidebench-benchmarking-domain-oriented-guideline-following-for-llm-agents]]
- [[20260521224403-sleepless-nights-sugary-days-creating-synthetic-users-health-conditions-coaching-agent-interactions]]
- [[20260522044805-promedts-a-self-supervised-prompt-guided-multimodal-approach-for-integrating-medical-text-and-time-series]]
- [[20260522105111-noreval-a-norwegian-language-understanding-and-generation-evaluation-benchmark]]
- [[20260522165534-one-for-all-pruning-universal-model-customized-compression-large-language-models]]
- [[20260522230110-cheems-practical-guidance-building-evaluating-chinese-reward-models-from-scratch]]
- [[20260523050504-abacus-sql-text-to-sql-system-cross-domain-open-domain-database-retrieval]]
- [[20260523110852-toolhop-query-driven-benchmark-evaluating-large-language-models-multi-hop-tool-use]]
- [[20260523171833-textagon-boosting-language-models-with-theory-guided-parallel-representations]]

ACL Anthology 論文紹介

Slack で紹介した ACL Anthology 論文の蓄積先。

Notes

[[2026-05-05041204-uieprompter-unified-training-free-framework-document-level-information-extraction]]
[[2026-05-05042552-speechee-xllm25-retrieval-enhanced-few-shot-prompting]]
[[20260505044017-llmsr-xllm25-empirical-study-llm-structural-reasoning]]
[[20260505045014-docie-xllm25-in-context-learning-synthetic-demonstrations]]
[[20260505045625-speechee-xllm25-end-to-end-structured-event-extraction-from-speech]]
[[20260505050232-zerosemble-zero-shot-document-information-extraction-heterogeneous-llm-ensembles]]
[[20260505050611-llmsr-xllm25-swrv-empowering-self-verification-of-small-language-models-through-step-wise-reasoning-and-verification]]
[[20260505080848-language-models-are-universal-embedders]]
[[20260505102051-transfer-structural-knowledge-synthetic-languages]]
[[20260505132404-cross-document-event-keyed-summarization]]
[[20260505162710-llmsr-xllm25-language-model-based-pipeline-for-structured-reasoning-data-construction]]
[[20260505192957-llm-dependency-parsing-with-in-context-rules]]
[[20260505223200-can-llms-interpret-and-leverage-structured-linguistic-representations-a-case-study-with-amrs]]
[[20260506013416-do-we-still-need-human-annotators-prompting-large-language-models-for-aspect-sentiment-quad-prediction]]
[[20260506043731-typed-rag-type-aware-decomposition-of-non-factoid-questions-for-retrieval-augmented-generation]]
[[20260506073928-bartabsa-revisiting-bartabsa-with-decoder-llms]]
[[20260506104209-structure-modeling-approach-for-ud-parsing-of-historical-modern-japanese]]
[[20260506134438-enhancing-amr-parsing-with-group-relative-policy-optimization]]
[[20260506164727-llmsr-xllm25-less-is-more-enhancing-structured-multi-agent-reasoning-via-quality-guided-distillation]]
[[20260506194943-combining-automated-and-manual-data]]
[[20260506225144-self-contrastive-loop-of-thought-method-for-text-to-sql-based-on-large-language-model]]
[[20260507015358-seamlessly-integrating-tree-based-positional-embeddings-into-transformer-models-for-source-code-representation]]
[[20260507045613-detecting-referring-expressions-in-visually-grounded-dialogue-with-autoregressive-language-models]]
[[20260507075854-from-syntax-to-semantics-evaluating-impact-linguistic-structures-llm-based-information-extraction]]
[[20260507110131-regular-pattern-sensitive-crfs-for-distant-label-interactions]]
[[20260507123042-the-distracting-effect-understanding-irrelevant-passages-in-rag]]
[[20260507153316-be-cautious-when-merging-unfamiliar-llms-phishing-model-capable-stealing-privacy]]
[[20260507213931-identifying-filled-pauses-in-speech-across-south-and-west-slavic-languages]]
[[20260508004401-minikv-pushing-the-limits-of-2-bit-kv-cache-via-compression-and-system-co-design-for-efficient-long-context-inference]]
[[20260508033705-seal-scaling-to-emphasize-attention-for-long-context-retrieval]]
[[20260508064908-a-reality-check-on-context-utilisation-for-retrieval-augmented-generation]]
[[20260508095215-teaching-an-old-llm-secure-coding-localized-preference-optimization-on-distilled-preferences]]
[[20260508124658-searchable-language-documentation-corpora-doreco-meets-teitok]]
[[20260508125442-longred-mitigating-short-text-degradation-of-long-context-large-language-models-via-restoration-distillation]]
[[20260508155854-on-the-path-to-make-ukrainian-a-high-resource-language]]
[[20260508220402-towards-conditioning-clinical-text-generation-for-user-control]]
[[20260509010628-os-genesis-automating-gui-agent-trajectory-construction-via-reverse-task-synthesis]]
[[20260509040114-vision-language-models-struggle-to-align-entities-across-modalities]]
[[20260509040908-strucom-a-novel-dataset-of-structured-code-comments-in-russian]]
[[20260509101343-assessing-dialect-fairness-and-robustness-of-large-language-models-in-reasoning-tasks]]
[[20260509131742-ecorag-evidentiality-guided-compression-for-long-context-rag]]
[[20260509161126-automixer-checkpoint-artifacts-as-automatic-data-mixers]]
[[20260509162000-learning-to-rewrite-generalized-llm-generated-text-detection]]
[[20260509192237-s3-semantic-signal-separation]]
[[20260509222459-clix-cross-lingual-explanations-of-idiomatic-expressions]]
[[20260510012713-beyond-the-tip-of-efficiency-uncovering-the-submerged-threats-of-jailbreak-attacks-in-small-language-models]]
[[20260510042917-lexclipr-cross-lingual-paragraph-retrieval-from-legal-judgments]]
[[20260510073149-focalpo-enhancing-preference-optimizing-by-focusing-on-correct-preference-rankings]]
[[20260510133604-when-the-dictionary-strikes-back-slovak-migration-location-extraction]]
[[20260510163823-taz2024full-analysing-german-newspapers-for-gender-bias-and-discrimination-across-decades]]
[[20260510193356-dialz-a-python-toolkit-for-steering-vectors]]
[[20260510194048-quantifying-misattribution-unfairness-in-authorship-attribution]]
[[20260510224256-beyond-the-answer-advancing-multi-hop-qa-with-fine-grained-graph-reasoning-and-evaluation]]
[[20260511014500-r2d2-remembering-replaying-and-dynamic-decision-making-with-a-reflective-agentic-memory]]
[[20260511044701-evaluating-robustness-of-llms-to-typographical-noise-in-yoruba-qa]]
[[20260511074941-finecite-a-novel-approach-for-fine-grained-citation-context-analysis]]
[[20260511105226-verify-with-caution-the-pitfalls-of-relying-on-imperfect-factuality-metrics]]
[[20260511135534-can-llms-reliably-simulate-real-students-abilities-in-mathematics-and-reading-comprehension]]
[[zhu-etal-2026-raffles]]
[[zhu-etal-2026-rethinking]]
[[zhu-etal-2026-scone]]
[[zhu-etal-2026-show]]
[[zhuang-etal-2026-workforceagent]]
[[zilio-finatto-2026-exploring]]
[[znotins-2026-pretraining]]
[[zou-etal-2026-active]]
[[zouhar-etal-2026-generating]]
[[20260511163501-v-alphasocial-benchmark-and-self-reflective-chain-of-thought-generation-for-visual-social-commonsense-reasoning]]
[[20260512043835-safe-enhancing-mathematical-reasoning-in-large-language-models-via-retrospective-step-aware-formal-verification]]
[[20260511224127-tokenisation-is-np-complete]]
[[20260512014427-reledit-evaluating-conceptual-knowledge-editing-in-language-models-via-relational-reasoning]]
[[20260512044731-assigning-distinct-roles-quantized-low-rank-matrices-weight-decomposition]]
[[20260512075131-awes-laws-and-flaws-from-todays-llm-research]]
[[20260512105924-effects-of-automatic-alignment-on-speech-translation-metrics]]
[[20260512140556-beyond-text-compression-evaluating-tokenizers-across-scales]]
[[20260512171145-pisco-pretty-simple-compression-for-retrieval-augmented-generation]]
[[20260512201733-mathagent-leveraging-mixture-of-math-agent-framework-real-world-multimodal-mathematical-error-detection]]
[[20260513082044-beyond-citations-integrating-finding-based-relations-for-improved-biomedical-article-representations]]
[[20260513112359-fraud-r1-multi-round-benchmark-assessing-robustness-llm-against-augmented-fraud-phishing-inducements]]
[[20260513142851-implicit-reasoning-transformers-reasoning-through-shortcuts]]
[[20260513083127-bitsandbites-at-semeval-2025-task-9-improving-food-hazard-detection]]
[[20260513113637-scaling-text-rich-image-understanding-code-guided-synthetic-multimodal-data-generation]]
[[20260513144015-user-side-model-consistency-monitoring-open-source-large-language-models-inference-services]]
[[20260513174316-calibraeval-calibrating-prediction-distribution-mitigate-selection-bias-llms-as-judges]]
[[20260513204713-training-long-context-llms-efficiently-via-chunk-wise-optimization]]
[[20260513235029-lost-in-literalism-how-supervised-training-shapes-translationese-in-llms]]
[[20260514025358-medec-a-benchmark-for-medical-error-detection-and-correction-in-clinical-notes]]
[[20260514055734-tracr-injection-distilling-algorithms-into-pre-trained-language-models]]
[[20260514090123-feat-preference-feedback-dataset-cost-effective-english-ai-tutoring]]
[[20260514120506-cheap-character-noise-for-ocr-robust-multilingual-embeddings]]
[[20260514150854-500xcompressor-generalized-prompt-compression-for-large-language-models]]
[[20260514211326-from-evasion-to-concealment-stealthy-knowledge-unlearning-for-llms]]
[[20260515001658-interpretable-company-similarity-with-sparse-autoencoders]]
[[20260515032029-improving-factuality-with-explicit-working-memory]]
[[20260515062341-expert-effective-and-explainable-evaluation-of-personalized-long-form-text-generation]]
[[20260515092716-coling-unia-at-scivqa-2025-few-shot-example-retrieval-confidence-informed-ensembling-for-multimodal-large-language-models]]
[[20260515123020-eliciting-in-context-retrieval-and-reasoning-for-long-context-large-language-models]]
[[20260515153420-digital-gatekeepers-googles-role-in-curating-hashtags-and-subreddits]]
[[20260515183807-helpsteer3-human-annotated-feedback-edit-data-inference-time-scaling]]
[[20260515214216-pvp-image-dataset-personalized-visual-persuasion]]
[[20260516004547-catching-stray-balls-football-fandom-impact-digital-discourse]]
[[20260516034926-secque-benchmark-evaluating-real-world-financial-analysis-capabilities]]
[[20260516065220-synthesizing-and-adapting-error-correction-data-mobile-large-language-model-applications]]
[[20260516095556-predicting-implicit-arguments-in-procedural-video-instructions]]
[[20260516130015-did-translation-models-get-more-robust-without-anyone-even-noticing]]
[[20260516160552-evaluation-attribution-bias-generator-aware-retrieval-augmented-large-language-models]]
[[20260516190926-metaphor-and-large-language-models-when-surface-features-matter-more-than-deep-understanding]]
[[20260516221248-beyond-demographics-fine-tuning-large-language-models-to-predict-individuals-subjective-text-perceptions]]
[[20260517101614-spectral-insights-into-data-oblivious-critical-layers-in-large-language-models]]
[[20260517132008-toolspectrum-towards-personalized-tool-utilization-for-large-language-models]]
[[20260517072333-locagent-graph-guided-llm-agents-for-code-localization]]
[[20260517102715-fedleke-federated-locate-then-edit-knowledge-editing-for-multi-client-collaboration]]
[[20260517133133-mdbench-synthetic-multi-document-reasoning-benchmark-generated-with-knowledge-guidance]]
[[20260517163617-enginius-a-bilingual-llm-optimized-for-plant-construction-engineering]]
[[20260517193916-the-2nd-automated-verification-of-textual-claims-averitec-shared-task-open-weights-reproducible-and-efficient-systems]]
[[20260517224315-d-gen-automatic-distractor-generation-and-evaluation-for-reliable-assessment-of-generative-models]]
[[20260518014614-improving-ai-assistants-embedded-in-short-e-learning-courses-with-limited-textual-content]]
[[20260518044934-repanda-pandas-powered-tabular-verification-and-reasoning]]
[[20260518165348-factdebug-semeval-2025-task-7-hybrid-retrieval-pipeline-for-previously-fact-checked-claims]]
[[20260518105642-minielm-lightweight-adaptive-query-rewriting-framework-e-commerce-search-optimization]]
[[20260518140058-when-should-dense-retrievers-be-updated-gradnormir]]
[[20260518170527-can-llms-generate-high-quality-test-cases-for-algorithm-problems-testcase-eval]]
[[20260518201025-inserter-speech-instruction-following-with-unsupervised-interleaved-pre-training]]
[[20260519081411-crisists-coupling-social-media-textual-data-and-meteorological-time-series-for-urgency-classification]]
[[20260519021630-tess-2-large-scale-generalist-diffusion-language-model]]
[[20260519052102-the-silent-saboteur-imperceptible-adversarial-attacks-against-black-box-rag-systems]]
[[20260519172445-mmlu-cf-a-contamination-free-multi-task-language-understanding-benchmark]]
[[20260519113029-dast-context-aware-compression-in-llms-via-dynamic-allocation-of-soft-tokens]]
[[20260519143358-visual-evidence-prompting-mitigates-hallucinations-in-large-vision-language-models]]
[[20260519221219-evaluating-llms-with-multiple-problems-at-once]]
[[20260520041556-span-labeling-with-large-language-models-shell-vs-meat]]
[[20260520102018-pap2pat-benchmarking-outline-guided-long-text-patent-generation-with-patent-paper-pairs]]
[[20260520162457-cadreview-automatically-reviewing-cad-programs-with-error-detection-and-correction]]
[[20260520222909-binary-classifier-optimization-for-large-language-model-alignment]]
[[20260521043246-llm-powered-test-case-generation-for-detecting-bugs-in-plausible-programs]]
[[20260521103602-promptwizard-optimizing-prompts-via-task-aware-feedback-driven-self-evolution]]
[[20260521163941-guidebench-benchmarking-domain-oriented-guideline-following-for-llm-agents]]
[[20260521224403-sleepless-nights-sugary-days-creating-synthetic-users-health-conditions-coaching-agent-interactions]]
[[20260522044805-promedts-a-self-supervised-prompt-guided-multimodal-approach-for-integrating-medical-text-and-time-series]]
[[20260522105111-noreval-a-norwegian-language-understanding-and-generation-evaluation-benchmark]]
[[20260522165534-one-for-all-pruning-universal-model-customized-compression-large-language-models]]
[[20260522230110-cheems-practical-guidance-building-evaluating-chinese-reward-models-from-scratch]]
[[20260523050504-abacus-sql-text-to-sql-system-cross-domain-open-domain-database-retrieval]]
[[20260523110852-toolhop-query-driven-benchmark-evaluating-large-language-models-multi-hop-tool-use]]
[[20260523171833-textagon-boosting-language-models-with-theory-guided-parallel-representations]]