PKU-DAIR实验室新手科研入门指南Repo重磅上线!
北京大学数据与智能实验室(Data And Intelligence Research Lab at Peking Univeristy,PKU-DAIR )致力于数据库系统、大数据管理与分析以及人工智能等领域的前沿研究。团队长期在理论和技术创新上不断探索,已在国际顶级学术会议或期刊发表论文200余篇,并推出多个开源项目,与多家知名企业开展了卓有成效的合作。
为帮助新手快速熟悉和进入相关科研领域,PKU-DAIR 实验室特别推出了新手入门指南Repo。本仓库基于课题组的科研积累,提供全面的入门论文、开源文档和技术指南等分享,旨在帮助初学者快速熟悉数据管理(Data Management, DM) 和 人工智能 (Artificial Intelligence, AI) 等前沿领域,具体包括AI系统、DB+AI、自动化机器学习、AI Agent等方向,搭建坚实的技术基础。无论你是刚入门的小白,还是希望加深理解的探索者,这里的资源将为你的学习与研究之旅提供有力支持。
资源亮点:
Repo Github链接:https://github.com/PKU-DAIR/Starter-Guide
- 科研入门指南
从基础到进阶,掌握高效阅读论文的技巧,以及如何做好研究的相关知识,帮助你更快融入学术环境,独立开展研究。具体包含以内容:
- "Crafting Your Research Future", Charles X. Ling and Qiang Yang
- "The Most Common Habits from English papers written by Chinese students", Felicia Brittman
- Advice on how to succeed in graduate school", Marie desJardins
- "Letter to research students" , Duane Bailey
- "Efficient Reading of Papers in Science and Technology", Michael J. Hanson
- "The Task of the Referee", A. J. Smith
- "How to do Research At the MIT AI Lab", MIT AI Lab
- 科研入门指南--如何做好科研, 如何写好论文?
- 如何读好学术论文?
- 研究方向一览
- AI系统方向:涵盖人工智能的基础知识、机器学习和深度学习系统框架,以及分布式训练和推理服务等关键技术。具体包含以下子方向:
- AI基础入门
- ML/DL系统框架
- 分布式训练
- LLM推理服务
- Diffusion(文生图、文生视频)推理服务
2. AutoML方向 :专注于自动化机器学习,涉及超参数优化、网络结构搜索和模型压缩等主题,提升机器学习的效率。具体包含以下子方向:
- AutoML与超参数优化
- 网络结构搜索(NAS)
- 模型压缩
- 大语言模型与AutoML
3. Database方向 :探索数据库系统的基础及其与人工智能的融合,包括经典数据库、AI4DB和向量数据库等内容。具体包含以下子方向:
- Classical Database System
- AI4DB
- Vector database
4. AI Agent方向 :研究智能代理的规划、感知和执行等能力,帮助构建更智能的系统。具体包含以下子方向:
- 综述
- Agent规划
- 数据获取与感知
- 执行与工具使用
- Agent Benchmark
5. Data-Centric ML方向:关注数据驱动的机器学习方法,包括ML、LLM的基础知识、算法和针对特定领域的应用。具体包含以下子方向:
- Data Centric ML Basic
- LLM and VLM Basic
- Data Centric LLM and VLM Algorithms
- Data Centric LLM and VLM Systems
- Data-Centric Domain-Specific LLMs
6. 扩散模型方向:介绍扩散模型的基本原理和应用,包括图像和视频生成、3D/4D生成技术。具体包含以下子方向:
- 扩散模型基础
- 扩散模型加速
- 文生图/视频
- 3D/4D生成
7. AI for Science方向:结合人工智能与科学研究,涵盖蛋白质建模、小分子建模和生物数据分析等重要领域。具体包含以下子方向:
- 综述
- 蛋白质建模
- 小分子建模
- DNA/RNA/Cell
8. Graph方向 :研究图神经网络及其在数据中心学习和图学习中的应用,推动图数据处理的发展。具体包含以下子方向:
- GNN基础
- 异构图GNN
- 以数据为中心的图学习
- GNN加速
- GNN与LLM结合
我们希望通过这些丰富的资源,帮助有志科研的同学尽快找到自己的方向和兴趣,在科研道路上更顺利地前行。
欢迎大家积极关注我们的Repo,提出宝贵的意见和issue,也欢迎加入我们课题组共同进行探索和创新,在科研的旅途中不断成长!期待在知识的海洋中与你相遇,共同迎接未来的挑战与机遇!
实验室简介
北京大学数据与智能实验室(Data And Intelligence Research Lab at Peking Univeristy,PKU-DAIR实验室)由北京大学计算机学院崔斌教授领导,长期从事数据库系统、大数据管理与分析、人工智能等领域的前沿研究,在理论和技术创新以及系统研发上取得多项成果,已在国际顶级学术会议和期刊发表学术论文100余篇,发布多个开源项目。课题组同学曾数十次获得包括CCF优博、ACM中国优博、北大优博、微软学者、苹果奖学金、谷歌奖学金等荣誉。PKU-DAIR实验室持续与工业界展开卓有成效的合作,与腾讯、阿里巴巴、苹果、微软、百度、快手、中兴通讯等多家知名企业开展项目合作和前沿探索,解决实际问题,进行科研成果的转化落地。
评论 0