Em Bé Trong 'Man Vs. Baby' Có Phải Là AI Không?

"Man vs. Baby" đã làm nổi bật một em bé sáu tháng tuổi như một nhân vật quan trọng xuyên suốt bốn tập của chương trình đặc biệt Giáng sinh Netflix. Với việc series dựa vào một diễn viên nhí thật cho các chuỗi cảnh chính, một số người hâm mộ tò mò về cách "Man vs. Baby" đã quản lý để thực hiện điều này một cách liền mạch.
Trong cuộc trò chuyện với LBB, đạo diễn David Kerr giải thích rằng họ đã sử dụng một số kỹ thuật để thể hiện việc kết hợp mượt mà em bé vào series, bao gồm casting cặp em bé song sinh giống hệt nhau, "machine learning" để phát triển nhiều biểu cảm của em bé, và CGI. Việc sử dụng machine learning (ML) về cơ bản xác nhận rằng sản xuất đã sử dụng trí tuệ nhân tạo (AI) cho em bé trong chương trình, vì ML là một tập con của AI, nhưng em bé vẫn có phần thuộc "con người".
Kerr giải thích những lý do chính tại sao họ sử dụng những kỹ thuật này, lưu ý rằng "một em bé sáu tháng tuổi sẽ không nghe chỉ đạo" và lịch trình chỉ cho phép em bé có mặt trên phim trường không quá hai giờ mỗi ngày:
"Chính WC Fields đã nói 'không bao giờ làm việc với trẻ em hoặc động vật.' Chà, trong 'Man Vs Bee' bạn diễn chính là một con vật, mặc dù là CG, và trong 'Man Vs Baby', bạn diễn chính không chỉ là một đứa trẻ, mà là một em bé sáu tháng tuổi. Và một em bé sáu tháng tuổi sẽ không nghe chỉ đạo. Em bé sẽ làm bất cứ điều gì em bé muốn làm tại bất kỳ thời điểm nào.
Bây giờ hãy nghĩ về lịch trình. Vì những lý do rất nhân đạo, một em bé không được phép có mặt trên phim trường quá hai giờ mỗi ngày. Nhưng điều đó không lý tưởng khi em bé xuất hiện trong hầu như mọi cảnh."
Kerr tiếp tục giải thích rằng sản xuất ban đầu đã casting một cặp song sinh giống hệt nhau làm "em bé chính" trước khi thêm một cặp làm dự phòng, cho phép họ quay với những em bé dự phòng và thực hiện "thay thế khuôn mặt" trong hậu kỳ. Đạo diễn cũng xác nhận việc sử dụng một mô hình latex được đúc sống động và có khớp nối của những em bé chính:
"Chúng tôi đã casting một cặp song sinh giống hệt nhau làm em bé chính. Chúng tôi đã casting thêm một cặp song sinh giống hệt nhau làm dự phòng. Những em bé dự phòng lớn hơn vài tháng, vì vậy có khả năng bò hơn. Nhưng chúng có kích thước gần giống với những em bé chính. Vì vậy chúng tôi có thể quay với chúng và thực hiện thay thế khuôn mặt trong hậu kỳ. Chúng tôi cũng có một em bé jelly, đó là một mô hình latex được đúc rất sống động và có khớp nối của những em bé chính, rất hữu ích trong việc tập dượt để khóa hành động trước khi đưa những em bé thật lên phim trường.
Nhưng, mặc dù trông giống thật một cách kỳ lạ, nó không đủ tốt để chịu được sự xem xét kỹ lưỡng trên màn hình. Vì vậy không có cảnh nào trong chương trình có em bé jelly. Ngay từ đầu, tôi hy vọng có được càng nhiều diễn xuất của em bé trong camera, trên phim trường càng tốt. Nhưng tôi biết tôi không thể dựa vào điều đó."
Kerr sau đó giải thích quy trình phức tạp của việc hợp tác với giám sát hiệu ứng hình ảnh của mình, sử dụng một phiên ghi hình diễn xuất để ghi lại hầu như tất cả các biểu cảm của những em bé tham gia:
"Tôi bắt đầu các cuộc thảo luận chi tiết với giám sát VFX của chúng tôi, Rob Duncan của Framestore, vì chúng ta đang ở thời điểm mà các công cụ AI đang được triển khai theo nhiều cách khác nhau nhưng nó vẫn là công nghệ rất mới. Và những gì chúng tôi cố gắng làm là ngay tại đỉnh cao của những gì có thể.
Chúng tôi muốn có một em bé CGI hoàn toàn trông hoàn toàn không thể phân biệt được với em bé chính, nhưng sẽ có chính xác hành động hoặc biểu cảm mà bất kỳ cảnh cụ thể nào yêu cầu. Vì vậy chúng tôi bắt đầu với một phiên ghi hình diễn xuất. Về cơ bản là hướng năm camera vào mỗi em bé chính của chúng tôi trong vài giờ với hy vọng ghi lại toàn bộ dải biểu cảm, thức, ngủ..."
Đạo diễn thừa nhận rằng đó là một "quy trình chậm" vì kỹ thuật machine learning mà họ sử dụng rất quan trọng trong việc "tạo ra một thư viện biểu cảm và hành động" mà họ có thể sử dụng trong quay phim và hậu kỳ:
"Framestore sau đó áp dụng machine learning vào cảnh quay kết quả, về cơ bản tạo ra một thư viện biểu cảm và hành động, với tiềm năng điều chỉnh những gì chúng tôi đã ghi lại thành các lựa chọn khác cho biểu cảm và hành động mà những em bé thực sự không thể hiện.
Trong hậu kỳ, chúng tôi đã sử dụng ngân hàng dữ liệu biểu cảm em bé để xây dựng các màn trình diễn. Bất chấp sự xuất sắc của đội VFX và các nhà hoạt hình của Framestore, đó không phải là trường hợp có được kết quả tức thì, dễ dàng. Đó là một quy trình chậm. Thường thì, sẽ có một chi tiết làm hỏng một cảnh: hình dạng miệng hoặc chớp mắt không trông hợp lý. Nhưng chúng tôi đã có một cuộc đối thoại sáng tạo, một sự trao đổi sôi nổi để phát triển các cảnh và tôi nghĩ chúng tôi đã đạt được một vị trí tuyệt vời."

Kerr chỉ ra rằng "những cảnh CG hoàn toàn thành công nhất là [họ] có tham chiếu cho biểu cảm hoặc hành động [họ] muốn cho em bé CG," lưu ý rằng nó tạo ra các biểu cảm khuôn mặt chân thực hơn.
"Một điều tôi học được là những cảnh CG hoàn toàn thành công nhất là những cảnh mà chúng tôi có tham chiếu cho biểu cảm hoặc hành động chúng tôi muốn từ em bé CG. Ngay cả khi nó được ghi lại trên một bối cảnh khác hoặc điều kiện ánh sáng khác. Mắt người rất giỏi trong việc phát hiện những chi tiết nhỏ của biểu cảm khuôn mặt nên càng chân thực bạn có thể, càng tốt."
Lời giải thích chi tiết của David Kerr về lý do sản xuất chọn dựa vào những kỹ thuật khác nhau này thể hiện sự phức tạp của quy trình khi kết hợp một em bé làm một trong những ngôi sao chính của chương trình. Mặc dù có thể có sự xem xét kỹ lưỡng đằng sau quy trình của họ, việc sản xuất sử dụng chúng là hợp lý do tính chất không thể kiểm soát của tình huống.
Trong một cuộc phỏng vấn riêng với Manchester Evening News, ngôi sao chính Rowan Atkinson nhấn mạnh rằng những em bé họ sử dụng là song sinh, chỉ ra rằng đó là một kế hoạch tuyệt vời trong quá trình quay:
"Chúng tôi nên nhấn mạnh tất nhiên rằng em bé là song sinh, bạn luôn chọn song sinh vì vậy nếu một em khó chịu bạn có thể đưa em kia vào. Bạn chỉ có thể có em bé trên phim trường trong 45 phút, tổng cộng hai giờ mỗi ngày và một ngày quay là tám hoặc mười giờ vì vậy có rất nhiều giờ thực sự không thể tiếp tục quay cảnh đó"
Atkinson cũng thừa nhận rằng các luật về lịch trình với diễn viên nhí khá "khó khăn", điều này giải thích tại sao chương trình sử dụng CGI trong hầu hết các chuỗi cảnh:
"Lịch trình với em bé rất khó khăn. Vì vậy chúng tôi có song sinh giống hệt nhau, những em bé chính, và sau đó chúng tôi có song sinh bò vì những em bé chính không thể bò. Vì vậy đó là lúc CGI xuất hiện, khi bạn cấy ghép khuôn mặt của em bé chính vào em bé bò."
"Man vs. Baby" là một trong những chương trình TV lớn nhất của Netflix phát hành vào tháng 12 năm 2025.
Tại Sao Việc Sử Dụng Machine Learning Của 'Man vs. Baby' Là Con Dao Hai Lưỡi

Mặc dù việc sử dụng trí tuệ nhân tạo đã bị một phần lớn bộ phận công chúng phản đối, đặc biệt là trong ngành làm phim, một số người sẽ lập luận rằng việc sử dụng machine learning cho "Man vs. Baby" là một công cụ thiết yếu để giúp series thành công, xem xét rằng họ không có quyền kiểm soát khả năng của một em bé sáu tháng tuổi trên phim trường vì luật lịch trình nghiêm ngặt.
Bất chấp việc sử dụng các công cụ trí tuệ nhân tạo như machine learning, sản xuất vẫn nỗ lực sử dụng nhiều kỹ thuật hơn, chẳng hạn như dựa vào song sinh giống hệt nhau và sử dụng em bé dự phòng để đảm bảo chuyển tiếp mượt mà giữa các cảnh.







