recognizing its pose in 3D which has been a challenge for video-based methods. Thus, recent computer vision studies focused on using depth maps for conducting activity recognition [38-42], Similar to that in the Architecture/Engineering/Construction (AEC) community, detecting and tracking skeleton and body pose estimation have quickly enabled re¬search on vision-based methods for monitoring worker safety, health monitoring, and activity analysis [8,43-45,71], Weerasinghe et al. [71 ] proposed a method of detecting and tracking workers in 3D using RGB- D sequences. Han et al. [46] studied consequent motion-analysis tech¬niques to detect the unsafe activities of workers by transforming the mo¬tion data onto a three-dimensional space and learn classifiers to detect unsafe activities. Soumitry and Teizer [44] proposed a rule-based classification of worker activities of as ergonomic or non-ergonomic, beneficial for worker training, education, safety, and health. Escorcia et al. [8] pro¬posed a discriminative learning/inference model for classifying activities conducted by single workers self-contained in short videos. As a first step, their method classified single activities per RGB-D sequence con¬taining one worker, however it did not model the variability in duration of single activities nor and the frequency or sequence of their transitions in a long sequence from one activity to another.
Over the past few years, many studies in the computer vision com¬munity have focused on activity recognition from various sequence lengths of RGB-D images (e.g., [38-42]). Sung et al. [39] proposed a method based on detecting and tracking body skeleton and representing them as histogram of gradient (HOG) features for generic human activity recognition from long sequences of RGB-D images. The structure of each activity was learned through hierarchical maximum entropy Markov model and dynamic programming. The RGB-D images used in their experiments were mainly first-person views consisting of simple activities captured under controlled conditions; for example brushing teeth, drinking water, cooking, and opening a
Results (
Vietnamese) 1:
[Copy]Copied!
công nhận của nó đặt ra trong mô hình 3D mà đã là một thách thức đối với phương pháp dựa trên video. Vì vậy, tại máy tính tầm nhìn nghiên cứu tập trung vào bằng cách sử dụng bản đồ chiều sâu cho tiến hành các hoạt động công nhận [38-42], tương tự như rằng cộng đồng kỹ thuật/kiến trúc xây dựng (AEC), phát hiện và theo dõi dự toán đặt ra bộ xương và cơ thể có một cách nhanh chóng cho phép re¬search trên tầm nhìn dựa trên phương pháp để theo dõi nhân viên an toàn, y tế giám sát và phân tích hoạt động [8,43 45,71], Weerasinghe et al. [71] đề xuất một phương pháp phát hiện và theo dõi các công nhân trong việc sử dụng 3D RGB - D cuỗi. Han et al. [46] nghiên cứu phân tích chuyển động theo sau tech¬niques để phát hiện các hoạt động không an toàn của công nhân bằng việc chuyển dữ liệu mo¬tion vào một không gian ba chiều và tìm hiểu máy phân loại để phát hiện các hoạt động không an toàn. Soumitry và Teizer [44] đề xuất một phân loại dựa trên nguyên tắc của công nhân hoạt động như ergonomic hoặc phòng không ergonomic, mang lại lợi ích cho nhân viên đào tạo, giáo dục, an toàn và sức khỏe. Escorcia et al. [8] pro¬posed một mô hình học tập discriminative/suy luận cho phân loại hoạt động thực hiện bởi người lao động đơn khép kín trong ngắn hạn video. Bước đầu tiên, phương pháp của họ phân loại các hoạt động duy nhất một RGB-D chuỗi con¬taining một công nhân, Tuy nhiên nó đã không mẫu biến đổi trong thời gian hoạt động duy nhất cũng không và tần số hoặc các trình tự của quá trình chuyển đổi của họ trong một chuỗi dài từ một trong những hoạt động khác.Trong những năm gần đây, nhiều nghiên cứu trong máy tính tầm nhìn com¬munity đã tập trung vào sự công nhận hoạt động của các chuỗi dài của RGB-D hình ảnh (ví dụ: [38-42]). Sung et al. [39] đề xuất một phương pháp dựa trên phát hiện và theo dõi bộ xương cơ thể và đại diện cho họ như là các biểu đồ của gradient (HOG) tính năng nhận dạng chung các hoạt động của con người từ chuỗi dài của RGB-D hình ảnh. Cấu trúc của mỗi hoạt động được học thông qua thứ bậc tối đa entropy Markov mô hình và lập trình năng động. Hình ảnh RGB-D được sử dụng trong các thí nghiệm của họ đã là chủ yếu là người đầu tiên xem bao gồm hoạt động đơn giản bị bắt theo điều kiện kiểm soát; Ví dụ: đánh răng, uống nước, nấu ăn, và mở một
Being translated, please wait..
Results (
Vietnamese) 2:
[Copy]Copied!
nhận tư thế của nó trong không gian 3D mà đã là một thách thức đối với các phương pháp dựa trên video. Vì vậy, nghiên cứu thị giác máy tính gần đây tập trung vào việc sử dụng các bản đồ độ sâu để tiến hành các hoạt động công nhận [38-42], tương tự như trong ngành Kiến trúc / Kỹ thuật / Xây dựng (AEC) cộng đồng, phát hiện và theo dõi bộ xương và cơ thể gây ra ước tính đã nhanh chóng kích hoạt re¬search về phương pháp dựa trên tầm nhìn về an toàn lao động giám sát, theo dõi sức khỏe và phân tích hoạt động [8,43-45,71], Weerasinghe et al. [71] đề xuất một phương pháp phát hiện và theo dõi các công nhân trong 3D sử dụng trình tự RGB- D. Han et al. [46] nghiên cứu tech¬niques chuyển động phân tích hậu quả để phát hiện các hoạt động an toàn của người lao động bằng cách chuyển đổi các dữ liệu mo¬tion vào một không gian ba chiều và phân loại học để phát hiện hoạt động không an toàn. Soumitry và Teizer [44] đề xuất một phân loại dựa trên nguyên tắc của hoạt động cho công nhân trong khi làm việc hoặc không làm việc, có lợi cho việc đào tạo nhân viên, giáo dục, an toàn và sức khỏe. Escorcia et al. [8] pro¬posed một mô hình học tập / suy luận phân biệt đối xử đối với các hoạt động được thực hiện bởi nhân viên duy nhất tự chứa trong đoạn video ngắn phân loại. Như là một bước đầu tiên, phương pháp của họ phân loại các hoạt động duy nhất cho mỗi RGB-D chuỗi con¬taining một công nhân, tuy nhiên nó không mô hình biến đổi trong suốt thời gian hoạt động đơn lẻ hay và tần số hoặc một chuỗi các quá trình chuyển đổi của họ trong một chuỗi dài từ một hoạt động để khác.
Trong vài năm qua, nhiều nghiên cứu trong com¬munity tầm nhìn máy tính đã tập trung vào việc công nhận hoạt động từ độ dài chuỗi khác nhau của hình ảnh RGB-D (ví dụ, [38-42]). Sung et al. [39] đề xuất một phương pháp dựa trên việc phát hiện và theo dõi bộ xương cơ thể và đại diện cho họ như biểu đồ của gradient (HOG) các tính năng công nhận hoạt động của con người chung chung từ chuỗi dài của RGB-D hình ảnh. Cấu trúc của mỗi hoạt động đã được học qua entropy tối đa mô hình Markov thứ bậc và lập trình năng động. Các hình ảnh RGB-D được sử dụng trong thí nghiệm của họ chủ yếu là quan điểm của người thứ nhất gồm những hoạt động đơn giản bắt trong điều kiện được kiểm soát; ví dụ như đánh răng, nước uống, nấu ăn, và mở một
Being translated, please wait..