Công nghệ hình ảnh y tế từ khi phát hiện tia X vào năm 1895, luôn là công cụ cốt lõi trong chẩn đoán y tế hiện đại. Tuy nhiên, trong quy trình truyền thống, dữ liệu thô từ quét CT cần được chuyển đổi thành hình ảnh trước khi được bác sĩ hoặc AI phân tích, quá trình này có thể dẫn đến mất mát thông tin quan trọng. Gần đây, một nghiên cứu do nhiều tổ chức ở Trung Quốc hợp tác thực hiện đã chứng minh lần đầu tiên rằng trí tuệ nhân tạo (AI) có thể trực tiếp trích xuất thông tin chẩn đoán từ dữ liệu thô của CT mà không cần dựa vào phục hồi hình ảnh, và việc kết hợp dữ liệu thô với hình ảnh có thể nâng cao đáng kể độ chính xác trong phân loại ác tính hoặc lành tính của nốt phổi. Phát hiện này cung cấp một cách tiếp cận hoàn toàn mới cho phân tích hình ảnh y tế.
Hạn chế của quy trình truyền thống: mất thông tin từ hình ảnh đến kiến thức
Dữ liệu thô từ quét CT là tín hiệu chưa xử lý được thiết bị thu thập trực tiếp, với khối lượng dữ liệu thường gấp 10-20 lần hình ảnh cuối cùng. Tuy nhiên, quy trình chẩn đoán truyền thống phải tái tạo dữ liệu thô thành hình ảnh 2D hoặc 3D qua các thuật toán, quá trình này có thể dẫn đến méo mó thông tin do các thao tác như nội suy hoặc giảm nhiễu. Ví dụ, đặc điểm của các tổn thương nhỏ có thể bị làm nhòa trong quá trình tái tạo hoặc bị ảnh hưởng bởi nhiễu khiến bác sĩ khó khăn trong việc đánh giá.
Mặc dù công nghệ AI đã có khả năng phân tích hình ảnh y tế hiệu quả, nhưng bản chất của nó vẫn là xử lý lại thông tin đã được “nén”. Nhóm nghiên cứu chỉ ra: “Hình ảnh được thiết kế cho thị giác của con người, trong khi tiềm năng của AI nằm ở việc xử lý các dữ liệu nguyên bản, chưa được đơn giản hóa”.
Nỗ lực đột phá: AI giải mã tín hiệu thô trực tiếp
Trong nghiên cứu tiên phong này, nhóm đã thu thập dữ liệu thô từ CT của 276 bệnh nhân cùng kết quả bệnh lý tương ứng, xây dựng mô hình chẩn đoán dựa trên học sâu. Bằng cách xác định khu vực tổn thương trong dữ liệu thô, mô hình AI đã học trực tiếp các đặc điểm tín hiệu và so sánh với mô hình hình ảnh CT truyền thống. Kết quả cho thấy:
Khả năng chẩn đoán độc lập từ dữ liệu thô gần như tương đương với hình ảnh CT
: Trong tập kiểm tra, mô hình chỉ sử dụng dữ liệu thô (AUC 0.782) gần với hiệu suất của mô hình dựa trên hình ảnh CT (AUC 0.807), chứng minh rằng có thể đạt được chẩn đoán hiệu quả mà không cần phục hồi hình ảnh.
Kết hợp dữ liệu thô và hình ảnh cho hiệu quả tốt hơn
: Mô hình kết hợp cả hai (chẳng hạn RGM-RX 4) thể hiện hiệu suất ổn định hơn trong nhiều nhóm bệnh nhân (như người cao tuổi, phụ nữ, nốt nhỏ), với AUC tăng tối đa lên đến 12.4%.
Người phụ trách nghiên cứu giải thích: “Dữ liệu thô có thể chứa các chi tiết mà hình ảnh CT không thể duy trì, chẳng hạn như tín hiệu suy giảm ở những góc nhìn cụ thể hoặc sự thay đổi cấu trúc nhỏ, thông tin này có thể bổ sung cho những thiếu sót của hình ảnh truyền thống khi được khai thác bằng AI.”
Ứng dụng thực tiễn: Từ phòng thí nghiệm đến tiềm năng y tế cơ sở
Phát hiện này đặc biệt quan trọng đối với những khu vực có nguồn lực y tế không đồng đều. Các bệnh viện cơ sở thường đối mặt với thiếu hụt bác sĩ chuyên khoa chẩn đoán hình ảnh, trong khi các thiết bị CT chính thống thường có khả năng thu thập dữ liệu thô. Nếu trong tương lai, có thể phát triển các công cụ AI nhẹ phù hợp với dữ liệu thô, bác sĩ ở tuyến dưới có thể trực tiếp sử dụng dữ liệu gốc từ thiết bị để sàng lọc nhanh chóng, giảm bớt sự phụ thuộc vào xử lý hình ảnh và kinh nghiệm của chuyên gia.
Hơn nữa, nhóm nghiên cứu đã phát hiện ra rằng mô hình AI có thể tự động tập trung vào khu vực tổn thương trong dữ liệu thô thông qua công nghệ trực quan hóa (như Grad-CAM), với mức độ chú ý gấp 1-2 lần so với khu vực không có tổn thương. Tính “có thể giải thích” này cung cấp cho bác sĩ cơ sở để hỗ trợ quyết định, như nhận diện những đặc điểm ác tính nhỏ dễ bị bỏ sót.
Thách thức và hướng đi tương lai
Mặc dù triển vọng rất tươi sáng, nghiên cứu này vẫn tồn tại giới hạn: các mô hình hiện tại phụ thuộc vào thông số cụ thể của thiết bị CT và việc xác thực dữ liệu quy mô lớn từ nhiều trung tâm vẫn chưa được thực hiện. Hơn nữa, yêu cầu tính toán cao của dữ liệu thô đặt ra thách thức cho phần cứng. Nhóm nghiên cứu cho biết bước tiếp theo sẽ tối ưu hóa hiệu suất thuật toán và khám phá mô hình có tính thích ứng cao cho các giao thức quét khác nhau.
Kết luận: Định nghĩa lại khởi điểm của hình ảnh y tế
Nghiên cứu này đã xác minh lần đầu tiên rằng “từ tín hiệu đến kiến thức” là con đường chẩn đoán trực tiếp, phá vỡ mô hình cố hữu “hình ảnh là phương tiện chẩn đoán” đã tồn tại hơn một thế kỷ. Khi công nghệ AI ngày càng sâu sắc, phân tích hình ảnh y tế trong tương lai có thể chuyển từ “ưu tiên thị giác con người” sang “ưu tiên bản chất dữ liệu”, mở ra con đường hiệu quả và đáng tin cậy hơn cho y học chính xác.
Như tác giả liên lạc của bài báo đã tóm tắt: “Chúng ta không cần để AI bắt chước cách con người nhìn hình ảnh, mà là để nó hoạt động theo cách tốt hơn phù hợp với bản chất của dữ liệu – đó có thể là hướng đi thực sự của sự tiến hóa AI trong y tế.”
(Lưu ý: Chỉ số AUC trong bài viết là chỉ số đánh giá hiệu suất của mô hình, giá trị càng gần 1 thì mức độ chính xác càng cao.)