Pháo hoa của
Những kỹ sư AI viết thư mục nếu bạn muốn trở thành một kỹ sư AI mà không xác nhận được từ đâu
# thư mục viết của kỹ sư AI nếu bạn muốn trở thành một kỹ sư AI mà không xác nhận được từ đâu, nền tảng Latent Space đã chọn lọc 50 bài báo, mô hình và blog cho bạn liên quan đến LLM, RAG, trí thông minh, hình ảnh, giọng nói, tinh chỉnh mô hình và nhiều lĩnh vực khác. Sau đây là một bộ sưu tập của các nội dung được giới thiệu, bao gồm 10 lĩnh vực nhỏ, mỗi lĩnh vực ưu tiên 5 bài báo quan trọng: 1. Frontier llms-gpt series sản phẩm: phát triển của GPT1 đến GPT4, và Codex, InstructGPT và các mô hình khác. - bài báo Claude: mô hình sản phẩm cạnh tranh Claude 3 và Gemini 1. - tập tài liệu LLaMA: mô hình mã nguồn mở hàng đầu, bao gồm LLaMA 1, 2, 3. - DeepSeek series: một phòng thí nghiệm mô hình tương đối rộng, bao gồm nhiều mô hình. Lĩnh vực ứng dụng của BERT: mặc dù BERT đã được thay thế bởi các mô hình khác trong một số nhiệm vụ, nó vẫn là chìa khóa cho mô hình phân loại năng lượng hoạt động. 2. benchmark và đánh giá (Benchmarks and Evals) - MMLU: kiến thức khoa học quan trọng nhất, được sử dụng rộng rãi như một bài kiểm tra khả năng lập luận tiểu thuyết. - để đánh giá ngữ cảnh ngắn. Tập câu hỏi toán học để kiểm tra hiệu suất của mô hình trong lập luận toán học. - IFEval: tiêu chuẩn dẫn đầu trong việc đánh giá nhiệm vụ hướng dẫn, thích hợp cho các nhiệm vụ tiếp theo. - thử thách ARC AGI: một tiêu chuẩn quan trọng cho khả năng suy luận trừu tượng của các mô hình thực tế. 3. Gợi ý thông tin kỹ thuật, ICL với loại tư duy (Prompting, ICL & Chain của Thought) -- gợi ý kỹ thuật ZongShu: tóm tắt rất nhiều nghiên cứu gợi ý liên quan đến kỹ thuật. Chín-of Thought và Tree of Thought: đã rõ ràng đưa ra cách để tăng thêm khả năng suy luận thông qua các chuỗi suy nghĩ và các phương pháp truy ngược. - Prompt Tuning và tự động Prompt engineering: với sự phát triển của tự động Prompt phân hủy thành công nghệ, Prompt thủ công không còn là lựa chọn duy nhất. 4. tìm kiếm cải tiến sản xuất (RAG) - giấy RAG của Meta: hiểu các khái niệm cơ bản của RAG. -- MTEB: là tiêu chuẩn của RAG đánh giá, mặc dù phải sống với những vấn đề ChaZhi lượng mô-đun, nhưng vẫn sử dụng rộng rãi. Lập bản Đồ -- GraphRAG: kết hợp kiến thức thực hiện các phương pháp RAG, khám phá nâng cao khả năng tra cứu thông tin tích cực. - RAGAS: phương pháp trực quan đánh giá RAG được giới thiệu bởi OpenAI. 5. Tạo vật thông minh (Agents) - SWE - Bench: bài kiểm tra cho mô hình ủy nhiệm của chính mã và sinh vật bình thường. -- ReAct: khám phá công cụ cho mô hình ủy nhiệm sử dụng và hàm gọi. - MemGPT: một cách để cùng lúc đạt được một ký ức tạm thời. - Voyager: mô hình kiến trúc tinh thần của Nvidia để nâng cao hiệu quả của các proxy. 6. tạo mã - tập dữ liệu trên Stack: tập dữ liệu mở nhìn vào việc tạo mã. Nghiên cứu sâu seek -Coder, Qwen2.5-Coder và các mô hình tạo mã nguồn mở khác. - HumanEval: nguồn phát sinh mã được sử dụng rộng rãi để kiểm tra khả năng lập trình của mô hình. - công nhận vấn đề an ninh trong việc tạo mã. 7. Vision - CLIP: hình ảnh biến hình đầu tiên, mặc dù bây giờ có một loạt BLIP, CLIP vẫn quan trọng. - SAM và SAM 2: mô hình cơ bản của sự phân chia hình ảnh và video. - mô hình ngôn ngữ hình ảnh (VLM) hoạt động: Flamingo và Chameleon của Meta, vân vân. Whisper: một mô hình nhận dạng giọng nói thành công, tích cực hỗ trợ nhiều đầu vào giọng nói. - AudioPaLM: mô hình giọng nói của Google, mô tả ứng dụng của PaLM trong công việc giọng nói. - Kyutai Moshi: mô hình giọng nói song công chất lượng cao. - OpenAI Realtime API: API USB cung cấp thêm tiếng nói và hình ảnh thời gian thực. 9. ảnh /Video LAN rộng (Image/Video Diffusion) - Latent Diffusion: công nghệ cốt lõi về mặt bên kia của phương pháp Diffusion Stable. - series dall-e: mô hình tạo ảnh của OpenAI có khả năng tạo ra ảnh dựa trên câu chuyện văn bản. - cohérence: cải thiện sự nhất quán trong việc tạo ra hình ảnh. - Sora: một đoạn văn đột phá cho đến công cụ sản xuất video, mặc dù bài báo chưa chính thức được công bố, nhưng ảnh hưởng của nó không thể bị bỏ qua. 10. tinh chỉnh (Finetuning) - LoRA và QLoRA: cung cấp phương pháp cho mô hình tinh chỉnh nhỏ giá rẻ. - DPO: phương pháp tinh chỉnh ưu tiên được hỗ trợ bởi OpenAI như một giải pháp thay thế cho PPO. - RL fine tuning: phương pháp tự học nâng cao khả năng suy luận. Danh sách này có thể gây nhiều áp lực, nhưng nếu bạn tiếp tục và dần dần tiêu hóa các bài báo này, bạn sẽ có thể kiểm soát được những kiến thức cốt lõi mà một kỹ sư ở al cần. Link gốc: web link Nozomi Kitay/Gal D/ 100 chân Moshi Moshi (feat. 100 chân) @ fang datong Moshi Moshi (feat. Hàng trăm) @QQ âm nhạc