ÇÑ ±ÇÀ¸·Î ³¡³»´Â ½ÇÀü LLM ÆÄÀÎÆ©´×
- ÀúÀÚ<°´Ù¼Ö> Àú
- ÃâÆÇ»çÀ§Å°ºÏ½º
- ÃâÆÇÀÏ2025-02-05
- µî·ÏÀÏ2025-11-21
º¸À¯ 5, ´ëÃâ 0,
¿¹¾à 0, ´©Àû´ëÃâ 0, ´©Àû¿¹¾à 0
Ã¥¼Ò°³
½Ç¹« ÇöÀå¿¡¼ ²À ÇÊ¿äÇÑ ÆÄÀÎÆ©´×, PEFT, vLLM ¼ºù ±â¼úÀ» Á÷Á¢ ½Ç½ÀÇÏ¸é¼ ¹è¿ö º¸ÀÚ!AI ±â¼úÀÇ ÃÖÀü¼±¿¡¼ ¹è¿ì´Â LLM ÆÄÀÎÆ©´×ÀÇ ¸ðµç °Í! ÀÌ·ÐÀû Åä´ëºÎÅÍ ½ÇÀü Ȱ¿ë±îÁö ´Ü°èº°·Î ¸¶½ºÅÍÇÒ ¼ö ÀÖ´Ù. NLPÀÇ ¿ª»çÀû ¹ßÀü°ú ¿ªÀüÆÄÀÇ ÇÙ½É ¿ø¸® ¸¶½ºÅÍ, GPT ¸ðµ¨ÀÇ ½ÉÃþ ÀÌÇØ: ¼¿ÇÁ ¾îÅÙ¼Ç, ÅäÅ©³ªÀÌÀú ±¸ÇöºÎÅÍ ½ÇÀü ÀÀ¿ë±îÁö, Gemma 2¿Í Llama 3 ÃֽŠ¸ðµ¨ ºÐ¼®°ú GPU º´·ÄÈ ÇнÀ, LoRA, QLoRA¸¦ Ȱ¿ëÇÑ ÆÄÀÎÆ©´× ±â¹ý ½Ç½À, vLLMÀ¸·Î ½ÇÁ¦ ¼ºñ½º¿¡ Àû¿ë °¡´ÉÇÑ ¸ðµ¨ ¼ºù µîÀÇ ³»¿ëÀÌ ´ã°Ü ÀÖ´Ù. Runpod ȯ°æÀÇ ½Ç½À ÇÁ·ÎÁ§Æ®¸¦ ÅëÇØ À̷аú ½Ç¹«¸¦ µ¿½Ã¿¡ ÇнÀÇÒ ¼ö ÀÖÀ¸¸ç, ´ÜÀÏ GPUºÎÅÍ ´ÙÁß GPU ȯ°æ±îÁö ½ÇÀü¿¡¼ ¹Ù·Î Ȱ¿ë °¡´ÉÇÑ ³ëÇϿ츦 Á¦°øÇÑ´Ù.
ÀúÀÚ¼Ò°³
±¸±Û ºÎƮķÇÁ 1±â ¼ö·á¸¦ ½ÃÀÛÀ¸·Î, ÇϳªÀºÇà 꺿 ÇÁ·ÎÁ§Æ®¿Í ÇÔ²² ±ÝÀ¶, ·Îº¿, ±³À° µî ´Ù¾çÇÑ ºÐ¾ß¿¡¼ AI ÇÁ·ÎÁ§Æ®¸¦ ¼öÇàÇß´Ù. ÀÚ¿¬¾î ó¸®(NLP)¿Í ¸ÖƼ¸ð´Þ ºÐ¾ß¿¡ ±íÀº °ü½ÉÀ» °¡Áö°í ÀÖÀ¸¸ç, ÇöÀç´Â ½ÇÀü °æÇèÀ» ¹ÙÅÁÀ¸·Î LLM ÆÄÀÎÆ©´× ±â¼ú ¿¬±¸¿¡ ÁýÁßÇϰí ÀÖ´Ù.
¸ñÂ÷
¢Ã 01Àå: NLPÀÇ °ú°Å¿Í ¿À´Ã 1.1 ÀÚ¿¬¾î ó¸® ¹ßÀüÀÇ ÁÖ¿ä ÀÌÁ¤Ç¥ 1.2 Ãʱ⠱â°è ¹ø¿ªÀÇ ¿ª»ç¿Í ÀüȯÁ¡ __1.2.1 ¾Æ¸£Ã÷·ç´Ï¿Í Æ®·Î¾á½ºÅ°ÀÇ ¿¬±¸ __1.2.2 À§¹öÀÇ Á¦¾È°ú Á¶ÁöŸ¿î-IBM ½ÇÇè __1.2.3 Ãʱ⠱â°è ¹ø¿ªÀÇ ÇѰè¿Í »õ·Î¿î Àüȯ 1.3 ÀΰøÁö´ÉÀÇ ½ÃÀÛ __1.3.1 Æ©¸µÀÇ Áú¹®: ±â°è´Â »ý°¢ÇÒ ¼ö Àִ°¡? __1.3.2 Æ©¸µ Å×½ºÆ®ÀÇ ÇѰè 1.4 ÀΰøÁö´ÉÀº ¾î¶»°Ô ÇнÀÇϴ°¡? __1.4.1 ÀΰøÁö´ÉÀÇ ÇнÀ ¸ÞÄ¿´ÏÁò ¹ßÀü °úÁ¤ __1.4.2 ÆÛ¼ÁÆ®·Ð: ÀΰøÁö´É ÇнÀÀÇ Ã¹°ÉÀ½ 1.5 ¿ªÀüÆÄ ¾Ë°í¸®Áò: ÇнÀÀÇ Çõ¸í __1.5.1 ºñ¼±Çü¼º: ´õ ¶È¶ÈÇÑ ÀΰøÁö´ÉÀ» ¸¸µå´Â ¿¼è __1.5.2 ¿ªÀüÆÄ ¾Ë°í¸®Áò 1.6 Æ®·£½ºÆ÷¸ÓÀÇ µîÀå: NLPÀÇ »õ·Î¿î ½Ã´ë ¢Ã 02Àå: GPT 2.1 ·±ÆÌ ¼Ò°³¿Í »ç¿ë¹ý __2.1.1 ·±ÆÌ ȸ¿ø °¡ÀÔ __2.1.2 Å©·¹µ÷ ±¸¸Å __2.1.3 Æ÷µå ±¸¼º __2.1.4 ÁÖÇÇÅÍ ·¦ 2.2 µ¥ÀÌÅÍ Áغñ¿Í ¸ðµ¨ ±¸¼º 2.3 ¾ð¾î ¸ðµ¨ ¸¸µé±â __2.3.1 ¶óÀ̺귯¸® ¼³¸í __2.3.2 __init__ ÇÔ¼ö __2.3.3 forward ¸Þ¼µå __2.3.4 generate ¸Þ¼µå 2.4 Optimizer Ãß°¡Çϱâ __2.4.1 µ¥ÀÌÅ͸¦ GPU·Î Àü´ÞÇϱâ __2.4.2 Loss ÇÔ¼ö ¸¸µé±â __2.4.3 Àüü ÄÚµå º¹½À 2.5 ¼¿ÇÁ ¾îÅÙ¼Ç Ãß°¡Çϱâ __2.5.1 ¹®ÀÚµé °£¿¡ Á¤º¸¸¦ ÁÖ°í¹Þ´Â ¹æ½Ä(Æò±Õ ¹æ½Ä) __2.5.2 Çà·Ä°ö ¿¬»êÀ¸·Î ´õ ºü¸£°Ô Á¤º¸¸¦ ÁÖ°í¹Þ±â __2.5.3 ¼¿ÇÁ ¾îÅÙ¼ÇÀ̶õ? __2.5.4 ¿Ö dk ·Î ³ª´²¾ß Çϴ°¡? __2.5.5 ¼¿ÇÁ ¾îÅÙ¼Ç Àû¿ëÇϱâ 2.6 ¸ÖƼÇìµå ¾îÅټǰú ÇǵåÆ÷¿öµå __2.6.1 ¸ÖƼÇìµå ¾îÅÙ¼Ç ¸¸µé±â __2.6.2 ÇǵåÆ÷¿öµå ¸¸µé±â 2.7 Blocks ¸¸µé±â 2.8 ÅäÅ©³ªÀÌÀú ¸¸µé±â __2.8.1 vocab_size º¯È¿¡ µû¸¥ ÅäÅ«È ºñ±³ __2.8.2 ÅäÅ©³ªÀÌÀú ¸¸µé±â ¢Ã 03Àå: Àüü ÆÄÀÎÆ©´× 3.1 Àüü ÆÄÀÎÆ©´× µ¥ÀÌÅÍ Áغñ __3.1.1 Àüü ÆÄÀÎÆ©´×ÀÇ ¿ø¸®¿Í Á¾·ù __3.1.2 ´Ù¾çÇÑ Å½ºÅ©¿Í µ¥ÀÌÅͼ __3.1.3 µ¥ÀÌÅÍ Àüó¸® 3.2 Gemma¿Í Llama 3 ¸ðµ¨ ±¸Á¶ ºÐ¼® __3.2.1 Gemma ¸ðµ¨ ±¸Á¶ ºÐ¼® __3.2.2 Gemma¿Í Gemma 2 ¸ðµ¨ ºñ±³ __3.2.3 Llama 3 ¸ðµ¨ ±¸Á¶ ºÐ¼® __3.2.4 GPT, Gemma, Llama ºñ±³ 3.3 GPU º´·ÄÈ ±â¹ý __3.3.1 µ¥ÀÌÅÍ º´·Ä ó¸® __3.3.2 ¸ðµ¨ º´·ÄÈ __3.3.3 ÆÄÀÌÇÁ¶óÀÎ º´·ÄÈ __3.3.4 ÅÙ¼ º´·Ä ó¸® __3.3.5 FSDP 3.4 ´ÜÀÏ GPU¸¦ Ȱ¿ëÇÑ Gemma-2B-it ÆÄÀÎÆ©´× __3.4.1 ·±ÆÌ ȯ°æ ¼³Á¤ __3.4.2 Gemma ¸ðµ¨ Áغñ __3.4.3 µ¥ÀÌÅͼ Áغñ __3.4.4 Gemma ¸ðµ¨ÀÇ ±â´É È®ÀÎÇϱâ __3.4.5 Ű¿öµå µ¥ÀÌÅÍ »ý¼º __3.4.6 µ¥ÀÌÅÍ Àüó¸® __3.4.7 µ¥ÀÌÅͼ ºÐ¸® ¹× ÄÝ·¹ÀÌÅÍ ¼³Á¤ __3.4.8 ÇнÀ ÆÄ¶ó¹ÌÅÍ ¼³Á¤ __3.4.9 Æò°¡ ¸ÞÆ®¸¯ Á¤ÀÇ __3.4.10 ¸ðµ¨ ÇнÀ ¹× Æò°¡ __3.4.11 ÆÄÀÎÆ©´×ÇÑ ¸ðµ¨ Å×½ºÆ® 3.5 ´ÙÁß GPU¸¦ Ȱ¿ëÇÑ Llama3.1-8B-instruct ÆÄÀÎÆ©´× __3.5.1 ·±ÆÌ ȯ°æ ¼³Á¤ __3.5.2 Llama 3.1 ÇнÀ ÆÄ¶ó¹ÌÅÍ ¼³Á¤ __3.5.3 µ¥ÀÌÅͼ Áغñ __3.5.4 Llama 3.1 ¸ðµ¨ ÆÄ¶ó¹ÌÅÍ ¼³Á¤ __3.5.5 Llama 3.1 ¸ðµ¨ ÇнÀ ÄÚµå »ìÆìº¸±â __3.5.6 Llama 3.1 ¸ðµ¨ ÇнÀ ½ÇÇà __3.5.7 Wandb ¼³Á¤°ú »ç¿ë __3.5.8 ÇнÀÇÑ Llama 3.1 ¸ðµ¨ Å×½ºÆ® __3.5.9 »ý¼ºµÈ ÅØ½ºÆ® µ¥ÀÌÅÍ OpenAI·Î Æò°¡Çϱâ __3.5.10 äÁ¡ Á¡¼ö ±¸Çϱ⠢à 04Àå: È¿À²ÀûÀÎ ÆÄ¶ó¹ÌÅÍ Æ©´× ±â¹ý(PEFT) 4.1 LoRA ÀÌ·Ð ¹× ½Ç½À __4.1.1 LoRA °³³ä __4.1.2 ·±ÆÌ ȯ°æ ¼³Á¤ __4.1.3 Gemma-2-9B-it ¸ðµ¨ Áغñ __4.1.4 µ¥ÀÌÅÍ Àüó¸® __4.1.5 LoRA ÆÄ¶ó¹ÌÅÍ ¼³Á¤ __4.1.6 ¸ðµ¨ ÇнÀ __4.1.7 ÇнÀÇÑ ¸ðµ¨ Å×½ºÆ®Çϱâ __4.1.8 ¸ðµ¨ ¼º´ÉÀ» OpenAI·Î Æò°¡Çϱâ 4.2 QLoRA ÀÌ·Ð ¹× ½Ç½À __4.2.1 ¾çÀÚÈÀÇ ÀÌÇØ __4.2.2 ·±ÆÌ ȯ°æ ¼³Á¤ __4.2.3 µ¥ÀÌÅͼ Áغñ __4.2.4 ¾çÀÚÈ ÆÄ¶ó¹ÌÅÍ ¼³Á¤ __4.2.5 ¸ðµ¨ Áغñ __4.2.6 ÆÄ¶ó¹ÌÅÍ ¼³Á¤ __4.2.7 ¸ðµ¨ ÇнÀ __4.2.8 Çã±ëÆäÀ̽º Çãºê¿¡ ¸ðµ¨ ¾÷·Îµå __4.2.9 ÇнÀÇÑ ¸ðµ¨ Å×½ºÆ® __4.2.10 Exact Match¸¦ Ȱ¿ëÇÑ Æò°¡ __4.2.11 OpenAI API·Î Æò°¡Çϱ⠢à 05Àå: vLLMÀ» Ȱ¿ëÇÑ ¼ºù 5.1 ÆäÀÌÁöµå ¾îÅÙ¼Ç ¿ø¸® 5.2 vLLM »ç¿ë ¹æ¹ý 5.3 LLaMA3 »ý¼º ¼Óµµ °¡¼ÓÈ 5.4 vLLMÀ» Ȱ¿ëÇÑ Multi-LoRA __5.4.1 Multi-LoRA ½Ç½À __5.4.2 ³ëÆ®ºÏ ȯ°æ¿¡¼ ½Ç½À 5.5 Multi-LoRA¸¦ »ç¿ëÇÒ ¶§ ÁÖÀÇÇÒ Á¡ ¢Ã ºÎ·Ï ¿ªÀüÆÄ ¼öÇÐÀû ¸®ºä ¿ªÀüÆÄ ÄÚµå ¸®ºä