LLMs show categorical perception and optimized data selection

By PulseAugur Editorial · Summary by gemini-2.5-flash-lite from 2 sources

Researchers have developed a new framework for optimizing data selection in large language models, adapting data weighting to specific tasks and models using efficient proxies. Another study investigates categorical perception in LLM hidden states, finding geometric warping at digit-count boundaries across various model families. This warping effect, termed "structural CP," appears to be an architectural property independent of explicit semantic knowledge. AI

Summary written by gemini-2.5-flash-lite from 2 sources. How we write summaries →

IMPACT These studies offer insights into improving LLM training efficiency and understanding their internal representations, potentially leading to more capable and robust models.

RANK_REASON The cluster contains two academic papers detailing novel research findings in LLM behavior and optimization.

Read on arXiv cs.CL →

COVERAGE [2]

arXiv cs.CL TIER_1 · Zibin Zheng · 2026-05-10 17:30

Learning Multi-Indicator Weights for Data Selection: A Joint Task-Model Adaptation Framework with Efficient Proxies

Data selection is a key component of efficient instruction tuning for large language models, as recent work has shown that data quality often matters more than data quantity. Accordingly, prior studies have introduced various multi-dimensional heuristics to evaluate and filter in…
arXiv cs.CL TIER_1 · Jon-Paul Cacioli · 2026-04-27 04:00

Categorical Perception in Large Language Model Hidden States: Structural Warping at Digit-Count Boundaries

arXiv:2603.28258v2 Announce Type: replace Abstract: Categorical perception (CP) -- enhanced discriminability at category boundaries -- is among the most studied phenomena in perceptual psychology. This paper reports that analogous geometric warping occurs in the hidden-state repr…

COVERAGE [2]

Learning Multi-Indicator Weights for Data Selection: A Joint Task-Model Adaptation Framework with Efficient Proxies

Categorical Perception in Large Language Model Hidden States: Structural Warping at Digit-Count Boundaries

RELATED ENTITIES

RELATED TOPICS