Khi di sản tại Hà Nội được dùng làm ‘marker’ cho trình diễn tác phẩm AR
Khi đã chọn công trình di sản làm marker cho trình diễn AR nghĩa là đương nhiên tụi mình đã xác định từ trước là sẽ ghê răng vì chọn đi theo hướng khó là Markerless AR chứ không phải Marker-based AR để triển khai được suôn sẻ. Lí do là bởi, marker được sử dụng cho phương án này hoàn toàn đều ở trong những điều kiện lí tưởng để việc nhận diện được dễ dàng nhất
2 yếu tố làm cho marker-based AR dễ dàng hơn, gồm: (1) Marker nên là một vật thể được chủ động tạo ra với đặc điểm nhận diện dễ ràng và (2) Marker nên được đặt tại địa điểm mà khả năng nhận diện nó ít chịu ảnh hưởng bởi thời tiết.
Hà Nội được CNN-Go mô tả là thành phố “châu Á nhất châu Á” với vẻ đẹp trộn lẫn song hành giữa cuộc sống thường nhật của người dân với di sản du lịch; trộn lẫn giữa Đông và Tây; giữa hiện đại, thuộc địa và truyền thống; giữa thiên nhiên và kiến trúc… mang đến những trải nghiệm đầy bất ngờ và thích thú, và dưới góc độ là một techlab về giải pháp công nghệ thì tụi mình cũng hoàn toàn confirm về sự “khó lường” này!
Nếu đặt chân đến các quốc gia đồng văn, ví dụ như Hàn Quốc, ta thấy chiếc cổng Quang Hóa Môn dẫn vào Cung Cảnh Phúc của nhà Triều Tiên hiện ra thật “rõ ràng” và nổi bật giữa nền trời xanh. Tình huống “thuận lợi cho công nghệ” như vậy có lẽ cũng xảy ra tương tự khi ta đứng trước Ngũ Phượng Lâu của Tử Cấm Thành Bắc Kinh hay rất nhiều công nhiều tiêu biểu của các quốc gia Đông Á.
Nhưng di tích ở Việt Nam và Hà Nội nói riêng thì thường không có đặc trưng với hình dáng (shape) rõ ràng và có “tính ổn định” cao như vậy.
Khi nói về một địa chỉ di tích Hà Nội, thường người ta không nói về “cảm thức nơi chốn” chỉ thuần xoay quanh công trình mà còn là một tổng thể bối cảnh với cây cối, mặt nước, con người xung quanh… Ta rất khó có thể gặp khoảnh khắc mà Khuê Văn Các hiển thị ra đầy đủ, ổn định và thật là nổi bật ‘shape’ của riêng công trình này.
Việc bị một vài cái cây, hoặc một cành cây mới mọc thêm nào đó che khuất toàn phần hoặc một phần của công trình kiến trúc là một chuyện phổ biến
Năng lực bảo tồn kết hợp với sự khắc nghiệt của khí hậu thường làm công trình biến dạng về hình dáng, chỉ nói riêng lớp sơn thì như liên tục được đổi áo mới với tốc độ cao (trước từng có “phong trào” phản đối sơn lại cho Tháp Rùa và Ô Quan Chưởng vì lí do quan ngại cho việc lớp “rêu phong” linh thiêng bị gột rửa, biến công trình trăm năm thành công trình 1 ngày tuổi xong phong trào cũng tự tan rã khi chứng kiến lớp rêu mộc đã nhanh chóng trở lại) và hiệu ứng thị giác cũng đa dạng và tạo ra những bất ngờ.
Kiến trúc của những công trình cổ tại Việt Nam cũng mang những đặc tính rất riêng với những đường nét bo góc của rồng, của phượng. Cứ tưởng là dễ thế nhưng đây lại chính là một trong những lí do cản trở chúng mình thực hiện rất nhiều. Bởi, chỉ cần đứng lệch khỏi vị trí nhận diện một chút thôi, máy đã không thể nhận diện được vật thể và không thể kích hoạt được bài diễn.
Để giải quyết được bài toán khó nhằn này, team VTT chúng mình đã phải dành rất nhiều thời gian để nghiên cứu, phát triển và sử dụng kết hợp nhiều công nghệ AR khác nhau. Thậm chí là sử dụng trí tuệ nhân tạo AI để tăng cường khả năng nhận diện cho công nghệ AR. Ban đầu, chúng mình cũng thử sức với công nghệ nhận diện hình ảnh. Hàng ngàn bức ảnh cho 6 địa điểm với nhiều điều kiện thời tiết khác nhau đã được triển khai. Thế nhưng hiệu quả cũng không khả quan. Các điểm ảnh được tạo ra là quá ít. Đã vậy, màu sắc của các công trình cũng không được nổi bật. Bởi, ở Việt Nam, các công trình được gọi là “cổ” khi nó cần phải bạc màu để thể hiện sự nhuốm màu của thời gian. Và đương nhiên, chỉ cần qua một cơn mưa, một mầm cây được tưới đủ nước và nhú lên, thì marker cũng hoàn toàn không thể nhận diện được. Thế là chúng mình lại như đưa dự án về mốc đầu tiên khi lại phải thử nghiệm công nghệ mới. Rất may là lần này chúng mình đã thành công.
Ấy thế nhưng, đó chưa phải là toàn bộ những khó nhằn của dự án. Phần hiệu chỉnh video cũng là thứ khiến team công nghệ chúng mình đau đầu không kém. Nếu như với 3 bài diễn ở Hà Nội, chúng mình hoàn toàn có thể xách ngay con xe ra và test thử, thu kết quả và báo lại lỗi ngay cho team công nghệ để sửa trong ngày; thì 3 bài diễn ở Wales lại phức tạp hơn.
Thứ nhất, 3 địa điểm này cách xa nhau khá nhiều chứ không gần như việc bạn có thể đi bộ từ Hồ Gươm ra Vườn hoa Con Cóc. Thứ 2, về phương tiện di chuyển chủ yếu tại Wales là phương tiện công cộng nên cũng không nhanh gọn được như việc đi xe máy ở Hà Nội. Và thứ 3, những địa điểm được chọn làm marker để fit video tưởng là dễ hóa ra lại cực khó. Đó là vắt vẻo ở trên tường mà ở giữa lại có một tượng đá đầu sư tử. Đó còn là một hình ô cửa sổ chữ nhật mà khi đưa vào không gian 3D, chúng mình cực khó để ước lượng vị trí mà video sẽ xuất hiện. Và là hình ảnh của một bức tường với 12 ô cửa sổ, mỗi ô lại ứng với một nội dung khác nhau.
Thành phẩm cuối cùng của chúng mình là một chiếc app AR hoàn chỉnh cho cả 6 bài diễn ở Hà Nội và Wales. Năm trên sáu bài diễn sử dụng marker là chính những địa điểm công cộng. Chỉ duy nhất một bài diễn ở Women by Street Club là sử dụng marker nhân tạo nhưng các đường nét cũng rất đơn giản. Eye See Ai là một cơ hội tuyệt vời để team công nghệ VTT đọ găng với những giới hạn của công nghệ và chứng minh năng lực không giới hạn của mình.