沙华煜 - Huayu Sha

关于我

生存还是死亡，这是一个问题。

我是沙华煜，复旦大学软件工程专业本科生。我的研究主要围绕 大语言模型评测、 医疗基准构建，以及 面向科研流程的智能系统。

我关注把研究做得可复现、可落地、可解释：从数据与评测设计，到工具链实现与系统化验证。

代表论文

全部论文

                2026
                
                arXiv preprint · ICML 2026 submission (under review)

SciAgentGym: Benchmarking Multi-Step Scientific Tool-use in LLM Agents

Yujiong Shen ^* , Yajie Yang ^* , Zhiheng Xi ^* , Binze Hu , Huayu Sha , Jiazheng Zhang , et al.

SciAgentGym benchmarks multi-step scientific tool use for LLM agents with 1,780 tools and long-horizon workflows. It reports systematic failures on extended ...

详情论文 BibTeX

                2026
                
                arXiv preprint

OpenNovelty: An LLM-powered Agentic System for Verifiable Scholarly Novelty Assessment

Ming Zhang ^* ^† , Kexin Tan ^* , Yueyuan Huang ^* , Yujiong Shen , Chunchun Ma , Li Ju , et al.

OpenNovelty builds an evidence-grounded agent pipeline for scholarly novelty assessment. Instead of giving opaque yes/no judgments, it retrieves related lite...

详情论文 BibTeX

                2025
                
                ACL 2026 Submission (Under Review)

LLMEval-Fair: A Large-Scale Longitudinal Study on Robust and Fair Evaluation of Large Language Models

Ming Zhang ^* ^† , Yujiong Shen ^* , Jingyi Deng ^* , Yuhui Wang ^* , Huayu Sha , Kexin Tan , et al.

LLMEval-Fair proposes a dynamic evaluation framework that samples unseen test sets from a large question bank, combines contamination-resistant curation with...

详情论文 BibTeX

          当前方向
        

          评测鲁棒性
          数据污染防御
          医疗 NLP
          专家验证
          新颖性评估
          科学评审