Google AI Mode nay hiểu hình ảnh tốt hơn — trải nghiệm mua sắm thông minh hơn
Kể từ khi Google ra mắt AI Mode vào tháng 3 năm nay, hãng đã không ngừng nâng cấp những tính năng để chatbot tìm kiếm trở nên linh hoạt, thông minh và hữu ích hơn. Mới đây, Google tung ra bản cập nhật giúp AI Mode hiểu visual prompts (ảnh hoặc video làm đầu vào) tốt hơn — một bước tiến quan trọng, đặc biệt trong ngữ cảnh mua sắm trực tuyến, khi người dùng thường tìm kiếm dựa vào hình ảnh mẫu.
Trước đây, nếu bạn gửi ảnh mẫu vào AI Mode để yêu cầu tìm sản phẩm tương tự, bạn có thể nhận được một đoạn văn dài giải thích — đôi khi “vô duyên” với tình huống. Giờ đây, với kỹ thuật “query fan-out” được áp dụng vào ảnh, AI Mode có thể chạy nhiều truy vấn ngầm để hiểu ý bạn muốn gì từ ảnh mẫu, và trả về kết quả trực quan, sát với yêu cầu mua sắm hơn.
Trong bài viết này, chúng ta sẽ khám phá cách Google cải thiện tính năng visual prompt, ứng dụng trong mua sắm, ưu và hạn chế hiện tại, và tương lai của AI Mode trong việc biến hình ảnh thành truy vấn thông minh.
Tại sao hiểu “visual prompt” lại quan trọng?
Visual prompt là gì?
Visual prompt là khi bạn gửi ảnh hoặc video mẫu làm đầu vào cho AI để hỏi: “Tìm món tương tự như ảnh này”, “Tôi thích phong cách này, tìm sản phẩm giống vậy” hoặc “Làm cách nào để phối đồ theo ảnh này?”. Trong mua sắm trực tuyến, visual prompt rất phổ biến: bạn chụp một bức ảnh món đồ bạn thích, và muốn tìm phiên bản tương tự online.
Khó khăn khi AI không hiểu ảnh tốt
Khi AI Mode trước đây nhận ảnh đầu vào, nó thường trả lời bằng văn bản giải thích, hoặc chỉ trích xuất những từ khóa từ ảnh mà thiếu sự hiểu ngữ cảnh hình ảnh — dẫn đến kết quả không sát hoặc quá chung chung. Ví dụ:
Bạn gửi ảnh quần barrel jeans — AI Mode trả “Jeans barrel là kiểu ống lửng rộng” chứ không liệt danh sách sản phẩm tương đồng.
Bạn gửi ảnh phòng ngủ “moody maximalist” — AI Mode chỉ liệt từ khóa hoặc mô tả thay vì tìm phòng mẫu tương tự để tham khảo.
Google thừa nhận điều này là “vô duyên” trong bối cảnh visual queries, và cho biết họ đã phát triển kỹ thuật query fan-out dành cho ảnh để cải thiện độ hiểu ảnh của AI Mode.
Cách Google áp dụng “query fan-out” cho ảnh
Kỹ thuật query fan-out là cách AI khởi chạy nhiều truy vấn con từ ảnh đầu vào để hiểu mọi khía cạnh — màu sắc, kết cấu, kiểu dáng, bố cục — rồi tổng hợp lại để trả kết quả sát nhất với ý bạn muốn.
Khi bạn gửi ảnh mẫu như “phòng maximalist moody”, AI Mode sẽ chạy nhiều truy vấn khác nhau như:
Kiểu ánh sáng tối, gam màu trầm
Phong cách nội thất tối đa (maximalist)
Cách sắp xếp nội thất, chất liệu gỗ, cây xanh
Kích thước, tỷ lệ ảnh để hiểu phối cảnh
Sau đó nó sẽ tổng hợp các kết quả và trả về các hình ảnh mẫu tương đồng, dẫn link đến sản phẩm hoặc nguồn tham khảo, chứ không chỉ giải thích văn bản.
Khi bạn hỏi “Tìm barrel jeans không quá bó” (find me barrel jeans that aren't too baggy), AI Mode giờ có thể:
Hiểu từ “barrel jeans” là kiểu denim có ống phồng nhẹ
Biết “không quá bó” là giới hạn độ ôm
Duyệt các sản phẩm jeans trên web, sắp xếp mẫu phù hợp
Trả danh sách sản phẩm kèm hình ảnh, link sản phẩm
Khi bạn hỏi tiếp “màu xanh đậm thôi” — AI tiếp tục lặp truy vấn chi tiết từ kết quả trước
Tất cả những điều này giúp AI Mode chuyển từ “chỉ mô tả” sang “tương tác hình ảnh – sản phẩm trực quan”.
Ứng dụng mua sắm: Google AI Mode + Visual Search
Tìm sản phẩm tương tự từ ảnh mẫu
Bạn chụp ảnh đồ bạn thấy ngoài cửa hàng hoặc trên mạng xã hội, gửi vào AI Mode và nhờ tìm món tương tự. Nhờ cải thiện hiểu ảnh, AI Mode có thể trả về các món tương đồng (về kiểu, màu, chất liệu) từ nhiều cửa hàng khác nhau. Ví dụ:
Chụp áo khoác bomber phong cách retro → đổi thành “tìm áo bomber tương tự màu xám”
Gửi ảnh túi xách — AI Mode trả các mẫu túi xách tương đồng, link mua, giá
Gửi ảnh phòng khách — AI Mode gợi ý bàn ghế, decor tương ứng
Gợi ý tiếp theo và tinh chỉnh kết quả
Không chỉ trả lần đầu — bạn có thể tiếp tục tương tác:
“Màu tối hơn chút”
“Giá dưới 100 USD”
“Chất liệu da thật”
“Có size L”
AI Mode sẽ dùng kết quả trước làm đầu vào để lọc tiếp, đưa ra lựa chọn tinh gọn hơn.
Ưu điểm & hạn chế của visual prompt nâng cao
Ưu điểm nổi bật
Kết quả trả về đi sâu hơn, sát hơn ngữ cảnh ảnh
Trải nghiệm mua sắm trực quan hơn, dễ chọn sản phẩm từ hình mẫu
Dễ tương tác tiếp, lọc tinh chỉnh — không phải bắt đầu từ đầu
Tiết kiệm thời gian tìm kiếm bằng từ khóa rời rạc
Cảm giác “AI hiểu hình ảnh bạn” — trải nghiệm tự nhiên hơn
Hạn chế & thách thức hiện tại
Bản cập nhật có thể chưa được triển khai rộng ngay — có người dùng sẽ chưa thấy tính năng mới ngay
Nếu ảnh mẫu chất lượng thấp, tối sáng kém, AI có thể hiểu sai
Những yêu cầu quá đặc thù (chất liệu hiếm, kiểu dáng quá mức) khả năng không tìm được
Nếu cửa hàng trực tuyến hoặc sản phẩm không có dữ liệu tốt, AI Mode khó gợi ra lựa chọn
AI đôi khi vẫn “lộ” phần logic xử lý ảnh — ví dụ khi thoát ra từ kết quả ảnh, bạn phải tương tác thêm màn hình web thông thường
Cách tiếp cận & trải nghiệm visual prompt với AI Mode
Nếu bạn đang dùng AI Mode trong Search, đây là cách thử tính năng visual prompt:
Bật AI Mode trong giao diện tìm kiếm (nếu được hỗ trợ ở vùng bạn)
Chọn tùy chọn gửi ảnh hoặc video mẫu
Nhập yêu cầu bằng ngôn ngữ tự nhiên, kèm điều kiện (ví dụ: “tìm kiểu váy như ảnh, màu pastel, giá từ 30‑60 USD”)
Nhận kết quả — thường là các hình ảnh tích hợp sản phẩm + link, chứ không chỉ mô tả
Tiếp tục hỏi chi tiết: “chất liệu cotton”, “ship đến Việt Nam”, “size M”,…
Chọn sản phẩm bạn thích, vào trang bán hàng để kiểm tra kỹ hơn
Tip nhỏ: dùng ảnh mẫu rõ nét, góc nhìn tốt và yêu cầu rõ ràng để AI hiểu đúng mong muốn của bạn.
Tương lai của AI Mode & visual shopping
Việc Google cải thiện khả năng hiểu hình ảnh trong AI Mode chỉ mới là bước đầu. Trong tương lai, ta có thể kỳ vọng:
Hỗ trợ video prompt: gửi đoạn video, AI tìm sản phẩm tương tự động
Tích hợp sâu hơn với cửa hàng local: khi bạn chụp ảnh sản phẩm ở cửa hàng, AI Mode có thể tìm món tương tự trong cửa hàng gần bạn
Đa ngôn ngữ & hiểu sâu bản địa: AI Mode hiểu prompt bằng tiếng Việt, tiếng Nhật, tiếng Ả‑rập… kết hợp ảnh + văn bản
Tính năng mua sắm theo ảnh sẽ trở thành mặc định — bạn chỉ gửi ảnh, AI Mode tự gợi ý & dẫn link
Hợp tác với nền tảng thương mại điện tử để hỗ trợ đặt hàng, kiểm tra tồn kho trực tiếp từ chatbot
Kết luận: Google AI Mode đang tiến đến “AI hiểu hình ảnh, trợ lý mua sắm”
Việc cập nhật để AI Mode hiểu visual prompts tốt hơn là bước tiến quan trọng trong hành trình biến chatbot tìm kiếm thành trợ lý mua sắm trực quan. Khi bạn không cần gõ từ khóa, chỉ gửi ảnh và hỏi — AI Mode sẽ hiểu, tìm sản phẩm tương đồng và đưa bạn ngay đến trang mua hàng — trải nghiệm sẽ liền mạch hơn rất nhiều.
Nếu bạn chưa thấy tính năng mới, đừng lo — Google thường triển khai dần theo vùng địa lý, hãy cập nhật ứng dụng hoặc đợi vài ngày. Trong tương lai, khi Google mở rộng bản cập nhật này ra nhiều ngôn ngữ và vùng lãnh thổ hơn, AI Mode có thể trở thành công cụ mua sắm trực quan quen thuộc mỗi ngày của bạn.