Google มีโมเดลและ API ของ AI ชั้นนำในอุตสาหกรรมให้เลือกมากมาย สำหรับการอนุมานทั้งในระบบคลาวด์และในอุปกรณ์ การอนุมานแบบไฮบริดช่วยให้คุณปรับสมดุลภาระงาน AI ระหว่างอุปกรณ์ในพื้นที่กับระบบคลาวด์ได้อย่างราบรื่น ซึ่งจะช่วยเพิ่มประสิทธิภาพ ลดค่าใช้จ่าย และเพิ่มความพร้อมใช้งาน
การอนุมานแบบไฮบริดมีข้อดีหลักๆ 2 ประการสำหรับแอป Android ของคุณ ดังนี้
- เพิ่มการเข้าถึงสูงสุด: โมเดลระบบคลาวด์เป็นตัวเลือกสำรองที่สำคัญเมื่อโมเดลในอุปกรณ์ เช่น Gemini Nano ไม่พร้อมใช้งานเนื่องจากข้อจำกัดด้านฮาร์ดแวร์ของอุปกรณ์หรือระบบปฏิบัติการ ซึ่งจะช่วยให้ฟีเจอร์ AI ของคุณยังคงทำงานได้ในอุปกรณ์ของผู้ใช้ที่หลากหลายที่สุดเท่าที่จะเป็นไปได้
- ความสามารถด้านต้นทุนและออฟไลน์: โมเดลในอุปกรณ์ช่วยให้มั่นใจได้ว่าฟีเจอร์ AI จะทำงานได้อย่างราบรื่นเมื่อผู้ใช้ออฟไลน์ นอกจากนี้ การส่งต่อ งานประจำไปยังอุปกรณ์ในพื้นที่ยังช่วยลดต้นทุนการอนุมานในระบบคลาวด์ได้อีกด้วย
ตัวเลือกในการใช้งาน
คุณสามารถใช้การอนุมานแบบไฮบริดได้โดยใช้วิธีต่อไปนี้
Firebase AI Logic Hybrid API
Firebase AI Logic Hybrid API มีอินเทอร์เฟซแบบรวมเป็นหนึ่งเดียวสำหรับ การแยกการอนุมานระหว่างสภาพแวดล้อมในระบบคลาวด์และในอุปกรณ์
โดยมีพารามิเตอร์ onDeviceConfig ที่ให้การควบคุมอย่างง่ายเพื่อกำหนดโหมดการอนุมานและจัดการการกำหนดเส้นทาง
PREFER_ON_DEVICE: พยายามใช้โมเดลในอุปกรณ์ และจะกลับไปใช้โมเดลที่โฮสต์ในระบบคลาวด์โดยอัตโนมัติหากโมเดลในอุปกรณ์ไม่พร้อมใช้งานหรือไม่รองรับคำขอPREFER_IN_CLOUD: พยายามใช้โมเดลที่โฮสต์บนระบบคลาวด์เมื่ออุปกรณ์ออนไลน์และโมเดลพร้อมใช้งาน โดยจะกลับไปใช้โมเดลในอุปกรณ์ก็ต่อเมื่ออุปกรณ์ออฟไลน์เท่านั้นONLY_ON_DEVICE: พยายามใช้โมเดลในอุปกรณ์ แต่จะแสดงข้อยกเว้นหากโมเดลไม่พร้อมใช้งานหรือไม่รองรับคำขอONLY_IN_CLOUD: พยายามใช้โมเดลที่โฮสต์ในระบบคลาวด์เมื่ออุปกรณ์ออนไลน์และโมเดลพร้อมใช้งาน โดยจะส่งข้อยกเว้นในกรณีอื่นๆ ทั้งหมด
val model = Firebase.ai(backend = GenerativeBackend.googleAI())
.generativeModel(
modelName = "gemini-2.5-flash",
onDeviceConfig = OnDeviceConfig(mode = InferenceMode.PREFER_ON_DEVICE)
)
val response = model.generateContent("Write a story about a green robot.")
print(response.text)
ดูรายละเอียดการติดตั้งใช้งานได้ในเอกสารประกอบของ Firebase และสำรวจตัวอย่าง AI แบบไฮบริดในแคตตาล็อก AI
การกำหนดเส้นทางที่กำหนดเอง
หากแอปมีข้อกำหนดทางธุรกิจหรือ UX ที่เฉพาะเจาะจง คุณก็สามารถใช้ตรรกะการกำหนดเส้นทางที่กำหนดเองได้เช่นกัน ซึ่งช่วยให้คุณกำหนดเส้นทางการอนุมานแบบไดนามิก โดยอิงตามปัจจัยแบบเรียลไทม์ เช่น
- เวลาในการตอบสนองของเครือข่าย
- ประสิทธิภาพของระบบอุปกรณ์ (เช่น ระดับแบตเตอรี่และภาระของโปรเซสเซอร์)
- ความซับซ้อนของคำค้นหาของผู้ใช้
แอปชั้นนำที่ใช้การกำหนดเส้นทางที่กำหนดเองของตนเองเพื่อมอบประสบการณ์การใช้งาน AI ที่เชื่อถือได้จะใช้แนวทางการอนุมานแบบไฮบริดที่กำหนดเองนี้ ซึ่งรวมถึงแอปต่อไปนี้
GBoard: Gboard ใช้การอนุมานแบบไฮบริดที่กำหนดเองเพื่อขับเคลื่อนเครื่องมือการเขียน เช่น พิสูจน์อักษรและเขียนใหม่
Kakao Mobility: Kakao Mobility สร้างเครื่องมือการแยกเอนทิตีโดยใช้การอนุมานแบบไฮบริดที่กำหนดเอง สำหรับบริการจัดส่งพัสดุ ซึ่งจะแยกชื่อผู้รับ ที่อยู่ และหมายเลขโทรศัพท์จากข้อความภาษาธรรมชาติโดยอัตโนมัติเพื่อปรับปรุง แบบฟอร์มคำสั่งซื้อ