เบื้องหลัง: การแบ่งส่วนลายน้ำด้วย AI ของ clear.photo

·4 min read

โลโก้แบนเนอร์ของ clear.photo

เคยสงสัยไหมว่า clear.photo ลบลายน้ำได้เนียนกริบจนภาพดูแทบไม่ถูกแก้ไขอย่างไร? แม้ขั้นตอนลบจะสำคัญ แต่ความมหัศจรรย์เริ่มตั้งแต่กระบวนการที่เรียกว่า watermark segmentation (การแบ่งส่วนลายน้ำ) ซึ่งเป็นก้าวแรกที่กำหนดคุณภาพผลลัพธ์โดยตรง

Watermark Segmentation คืออะไร?

เปรียบเหมือนการสร้างแผนที่หรือสเตนซิลที่แม่นยำมาก เพื่อร่างขอบเขตลายน้ำบนภาพ การลบลายน้ำที่ดีไม่ใช่แค่ลบพิกเซลทิ้ง แต่คือการระบุให้ได้ว่าอะไรคือพิกเซลของลายน้ำจริง ๆ และแยกออกจากคอนเทนต์ของภาพที่อยู่ด้านล่างอย่างถูกต้อง

มาสก์การแบ่งส่วนนี้คือข้อมูลสำคัญที่ป้อนให้ขั้นตอนถัดไป: การสร้าง/ซ่อมแซมพื้นที่ที่เคยมีลายน้ำ หากแบ่งส่วนไม่แม่นยำ เครื่องมืออาจลบโดนส่วนสำคัญของภาพหรือทิ้งร่องรอยไม่พึงประสงค์ไว้

AI เรียนรู้ที่จะ "มองเห็น" ลายน้ำได้อย่างไร

ที่ clear.photo เราใช้โมเดลการเรียนรู้เชิงลึกขั้นสูง ซึ่งได้รับการฝึกเฉพาะทางสำหรับงานนี้ แล้วเราสอนให้ AI แม่นยำได้อย่างไร?

  1. ข้อมูลฝึกสอน: เราใช้เทคนิค การสร้างข้อมูลสังเคราะห์ (synthetic data generation) วางลายน้ำหลายรูปแบบ (โลโก้ ขนาด ตำแหน่ง ความทึบ การหมุน โหมดผสม) ลงบนภาพฉากหลังที่หลากหลายจำนวนมหาศาล
  2. การเรียนรู้รูปแบบ: จากคอมบิเนชันที่มากมาย โมเดลเรียนรู้ลักษณะพื้นผิว ลวดลาย และคุณสมบัติที่บ่งบอกความเป็นลายน้ำ แยกมันออกจากความแปรผันตามธรรมชาติของภาพ ถึงแม้ฉากหลังซับซ้อนก็ยังตรวจจับได้
  3. การสร้างมาสก์: เมื่อฝึกเสร็จ AI สามารถสร้างมาสก์ที่เน้นเฉพาะพิกเซลของลายน้ำได้อย่างแม่นยำ

กระบวนการฝึกที่เข้มข้นนี้ทำให้การแบ่งส่วนของเรามีความแม่นยำสูง เป็นพื้นฐานของผลลัพธ์ที่ดีกว่าในขั้นตอนถัดไป

กระบวนการสองขั้นของการลบลายน้ำ

กระบวนการลบลายน้ำขั้นสูงแบบที่ clear.photo ใช้ มักประกอบด้วยสองช่วงหลัก:

  1. การแบ่งส่วน (Segmentation): AI สร้างมาสก์ที่แยกพิกเซลของลายน้ำออกมาอย่างแม่นยำ
  2. การเติมเต็ม/บูรณะ (Inpainting/Restoration): ใช้มาสก์เป็นแนวทาง อัลกอริทึมขั้นสูงอีกตัว (มักเป็นโมเดลกำเนิดภาพ) เติมหรือสร้างพื้นที่ที่เคยเป็นลายน้ำให้กลมกลืนกับฉากหลัง

ความแม่นยำในขั้นที่ 1 มีความสำคัญอย่างยิ่งต่อผลลัพธ์ไร้ที่ติในขั้นที่ 2

เห็นภาพกระบวนการ

นี่คือตัวอย่างสิ่งที่การแบ่งส่วนด้วย AI ทำได้:

ภาพต้นฉบับพร้อมลายน้ำและมาสก์การแบ่งส่วนที่สร้างโดย AI ภาพอินพุต (ซ้าย) และมาสก์ที่ AI สร้าง (ขวา) ซึ่งระบุพิกเซลลายน้ำอย่างแม่นยำ

อีกตัวอย่างที่แสดงการแบ่งส่วนลายน้ำที่ซับซ้อนอย่างแม่นยำ แม้ฉากหลังหลากหลายและสไตล์ลายน้ำต่างกัน AI ก็ยังระบุขอบเขตได้อย่างถูกต้อง

เปิดโอเพ่นซอร์สแกนหลักการแบ่งส่วนของเรา

เทคโนโลยีการแบ่งส่วนที่ขับเคลื่อน clear.photo ตั้งอยู่บนงานวิจัยล้ำสมัยด้าน AI และการประมวลผลภาพ โดยได้แรงบันดาลใจจากงานอย่าง WDNet (arXiv:2012.07616) และเทคนิคการสร้างข้อมูลที่ทนทาน (arXiv:2502.02676).

เพื่อส่งเสริมความร่วมมือและพัฒนาวงการ เราได้ เปิดซอร์สโค้ดพื้นฐาน สำหรับงานแบ่งส่วนนี้ สามารถดูได้ที่:

https://github.com/Diffusion-Dynamics/watermark-segmentation

รีโพนี้ให้ โค้ดขั้นต่ำที่ใช้งานได้จริง เพื่อสาธิตแนวคิดหลัก จุดมุ่งหมายคือทำให้เข้าใจง่ายและต่อยอดได้สะดวก

เริ่มต้นด้วยน้ำหนักโมเดลที่ฝึกไว้แล้ว

เพื่อให้ผู้พัฒนาและนักวิจัยเริ่มได้รวดเร็ว รีโพมี น้ำหนักโมเดลที่ฝึกไว้แล้ว (.pth) คุณสามารถดาวน์โหลดและใช้ Jupyter notebook (watermark-segmentation.ipynb) เพื่อ:

  • รันอินเฟอเรนซ์กับรูปของคุณทันที
  • ปรับจูนโมเดล (fine-tune) ให้เข้ากับลายน้ำเฉพาะของคุณ หรือประยุกต์กับงานแบ่งส่วนภาพที่เกี่ยวข้อง

การปรับจูนด้วยน้ำหนักที่มีช่วยลดทั้งข้อมูลและเวลาคอมพิวต์ (ทำบนแล็ปท็อปยุคใหม่ก็ไหว) เมื่อเทียบกับการฝึกจากศูนย์ ทำให้เทคโนโลยีระดับสูงเข้าถึงได้มากขึ้น

แม้โค้ดโอเพ่นซอร์สจะเน้นส่วนแบ่งส่วน แต่การสร้างเครื่องมือลบลายน้ำระดับโปรดักชันแบบ clear.photo ยังต้องอาศัยขั้นตอนซับซ้อนต่อไป เช่น inpainting ขั้นสูง

ทำไมความแม่นยำของการแบ่งส่วนจึงสำคัญกับคุณ

แม้เทคโนโลยีเบื้องหลังจะซับซ้อน แต่ประโยชน์สำหรับคุณนั้นชัดเจน: ผลลัพธ์ที่สะอาดและเป็นธรรมชาติกว่า ด้วยการแบ่งส่วนลายน้ำที่แม่นยำก่อน clear.photo จึงลบได้ตรงจุดและรักษารายละเอียดภาพดั้งเดิมไว้

สัมผัสความต่างจากการแบ่งส่วนขั้นสูงของเรา ลองใช้ clear.photo วันนี้เลย!