Ergonomics/Paper

[Review]Prediction of Mental Workload in Single and Multiple Tasks Environments

my_log 2021. 11. 18. 10:12
  • 목차
    1. Introduction
    2. Models and Hypotheses
    3. Methodology
    4. Results and DIscussions
    5. Conclusion and Implications

Abstract

이 연구는 개별 요소를 특별히 고려하여 단일 및 다중 작업 환경 모두에서 정신적 작업 부하를 예측하기 위한 실질적인 프레임워크를 개발하고 검증하는 것을 목표로 했다. 정신적 워크로드를 보다 정확하고 완전하게 설명하기 위해 즉각적인 워크로드, 평균 워크로드, 누적 워크로드, 최대 워크로드 및 전체 작업 부하를 포함하는 정신적 워크로드 측정 프레임워크가 제안된다. 개별 요인을 모델링하기 위해 작업 및 개별 생성 워크로드를 개념적으로 모델링하기 위해 2가지 새로운 변수(효율적 워크로드와 비효율적 워크로드)를 도입했다. 개념 모델 하에서 인간-컴퓨터 상호작용 작업에 대한 인간의 정신적 작업부하를 예측하기 위한 운영 모델이 개발되었다. 이 모델은 다차원적 접근 방식을 사용했으며 부하에 대한 여러 측면을 정량화할 수 있었다. 제안된 모델을 검증하기 위해 두 가지 실험 연구가 수행되었다. 그 결과 (a) 평균 작업 부하, 누적 작업 부하 및 순간 작업 부하로 구성된 프레임워크가 단일 전체 작업 부하보다 더 정확하게 작업 부하에 대해 설명할 수 있다는 사실이 밝혀졌다. (b) NASA-작업 부하 지수 주관적 정신 부하 등급과 관련된 변동의 42%를 설명하는 제안된 정신 작업 부하 모델 그리고 성능 시간과 연관된 분산의 78%가 지원되었고 정신적 작업부하를 예측하는 데 사용될 수 있었다. (c) 유효/비효과적 작업부하에 대한 4개의 독립 변수 사이의 재결합은 부분적으로 검증되었다. 결과는 작업 관련 요소와 개별 관련 요소 모두 정신 작업 부하에 영향을 미칠 수 없다는 것을 보여주었다. (d) 정신 작업 부하가 시간 압력에 의해 크게 영향을 받았다. 자가 페이싱 멀티태스킹 환경의 워크로드는 실험의 시스템 페이싱 멀티태스킹 환경의 워크로드보다 29% 낮았다. 셀프 페이싱 멀티태스킹 환경의 워크로드는 시스템 페이싱 단일 작업 환경의 워크로드보다 19% 낮았다.

Introduction

정신적 작업부하는 오랫동안 복잡한 시스템에서 인간 성능의 중요한 요소로 인식되어 왔다(Gopher & Donchin, 1986; Hancock & Meshkati, 1988; Moray, 1979a; O'Donnell & Egmeier, 1986). Moray(1988)는 운영자에 대한 정신적 작업 부하 할당을 최적화하면 인적 오류를 줄이고 시스템 안전을 개선하며 생산성을 높이고 운영자의 만족도를 높일 수 있다고 지적했다. 따라서 초기 설계 단계에서 정신적 작업부하를 평가하고 예측하기 위한 몇 가지 도구가 분명히 필요하다.

상식적으로 볼 때, 모든 사람들은 정신적 작업 부하가 무엇인지 이해하는 것 같지만 간단하지 않기에 정신 작업부하를 정의하기 위해 광범위한 연구가 수행되어야 했다. 좀 더 정확한 정의는 그 일을 성취하기 위한 인적 자원의 고갈을 포함한다. 정신적 작업부하는 직접적으로 감지될 수 없지만 주관적 등급, 성과 또는 일부 생리학적 변수와 같은 정신적 작업부하와 높은 상관관계가 있는 것으로 생각되는 일부 다른 변수를 통해서만 간접적으로 측정할 수 있다. 정신적 작업부하는 다차원 변수이며 많은 요인에 의해 영향을 받을 수 있다(Meshkati, 1988). 문헌을 검토하면서, 정신적 작업 부하에 대한 정의와 척도가 균일하지 않다는 것을 발견했다. 수많은 정의가 제안되었지만, 그 중 어느 것도 광범위한 허용 또는 정량적 검증 테스트를 통과할 수 없었다(린튼, 플라몬던, & 딕, 1989; 창 & 윌슨, 1997). 정신적 작업부하는 불완전하게 벌금이 부과되고, 확실히 다면적이며, 성능 수준을 유지하거나 도달하는 운영자의 능력과 직접적인 관련이 있다.

Models and Hypotheses

대부분의 기존 방법은 전체 작업 부하(예: 주관적 평가), 평균 작업 부하(예: Tr/Ta 또는 비트/초) 또는 누적 작업 부하(예: 비트)와 같은 한 가지 유형의 정신적 작업 부하만 측정하며, 실제로 서로 다른 전체 작업 부하, 평균 작업 부하 및 누적 작업 부하 사이의 명확한 구분이 없다. 예를 들어, 사용 가능한 시간 경과에 따른 과제 수행에 필요한 시간(Tr/Ta)은 많은 평가 기법에서 널리 사용되는 척도이다. 이것은 실제로 평균 작업 부하에 대한 척도이다. 이 조치에 따르면 2시간 사용 가능한 1시간이 필요한 작업은 2,000시간 사용 가능한 1,000시간이 필요한 작업과 동일한 워크로드를 생성한다. 이 두 가지 작업은 전체적으로 서로 다른 워크로드를 생성합니다. 따라서 Tr/Ta는 워크로드의 강도만 설명한다. 이 예는 다음과 같은 것을 보여준다.

두 작업이 한 유형의 정신적 작업 부하 측정에서 동일한 값을 얻는다고 해서 반드시 다른 유형의 작업 부하 측정에서 동일한 값을 갖는 것은 아니다. 누적 워크로드와 평균 워크로드가 동일하더라도 피크 부하가 다른 순간 또는 순간 작업 부하 곡선에 다른 방식으로 나타나는 경우 작업 부하에 대한 주관적 등급이 달라진다(Thornton, 1985; Yeh & Wickens, 1985).

단일 유형의 워크로드 측정으로는 정신적 워크로드를 적절하게 설명할 수 없기 때문에 이 문서에서는 여러 유형의 측정, 즉, 순간 워크로드, 최대 워크로드, 누적 워크로드, 평균 워크로드 및 전체 워크로드를 포함하는 프레임워크를 제안한다. 여러 유형의 정신적 작업 부하를 사용하면 확실히 정신적 작업 부하를 더 정확하고 완전하게 설명할 수 있다. 각 측정치는 고유한 의미를 가지고 있으므로 서로 다른 측정치를 구별하는 것이 매우 필요하며 혼동해서는 안 된다.

<The relationships among all five types of workload measures>

 

<The relationship between the various workload measures is mathematically defined>

  • 즉각적인 워크로드는 워크로드의 역학을 측정한다. 단일 정적 값보다는 사건 과정에서 정신적 작업부하는 시시각각 달라질 수 있다(오들리, Rouse, Senders, & Sheridan, 1979; Madni & Lyman, 1983; Rouse, 1979; Rouse, Edward, & Hammer, 1993). 샤리트와 살벤디(1982)와 샤리트, 살벤디, 데이젠로트(1982)에서 보고된 바와 같이 대부분의 생리학적 측정값은 순간적인 작업 부하 값이다. 주관적 측정 및 천공적 측정과 같은 다른 작업 부하 평가 기법도 순간 작업 부하 또는 적어도 단기 작업 부하 평가에 사용할 수 있다(Antin & Wierwille, 1984; Verwey & Veltman, 1996; Wierwille, 1981). 이 변수를 사용하여 작업 수행의 시작부터 종료까지 각 순간의 정신적 작업량을 측정할 수 있다. 실제로, 이 변수는 가장 기본적인 변수입니다. 다른 정신적 작업 부하 측정의 기반이며 이 변수에서 파생될 수 있다. 변수는 워크로드의 추세와 패턴을 설명하는 데 사용된다.
  • 피크 로드는 작업을 수행할 때 감지되는 순간적인 정신적 작업 부하의 최대값이다. 피크 로드의 사용은 Jex(1988년) 및 Soed(1979년)와 같은 많은 보고서에서 확인할 수 있다. 최대 로드는 모든 순간 워크로드의 크기를 비교하여 얻을 수 있다. 최대 부하가 인적 자원 한도를 초과할 경우 작업자가 그 순간에 너무 많은 작업 부하에 직면하여 성능 저하를 초래할 수 있다. 피크 로드를 과부하 한계로 유지하면 작업자의 성능을 안정화하는 데 도움이 된다.
  • 사람들은 어려운 일을 거의 힘들이지 않고 수행할 수 있을 만큼 충분히 숙련되어 있을 것이다. 비슷하게, 겉으로 보기에 매우 간단해 보이는 일은 지식과 기술이 부족하기 때문에 많은 사람들에게 어려울 수 있다. 따라서 작업량은 반드시 업무와 개인에 따라 다르다. 정신적 작업 부하에 대한 주관적 느낌과의 일관성을 위해 제안된 예측 모델에서 개별 요인을 고려해야 한다.
  • 자원이 제한된 프로세스(Norman & Bobrow, 1975)에서 사람들은 대개 오류를 범하고 100% 효율성에 도달할 수 없다. 데이터 제한 작업(Norman & Bobrow, 1975년)에서도 많은 오류가 표시되는 정보의 잘못된 신호 대 잡음 비율, 지연 정보 및 잘못된 공식화된 문제 등으로 인해 발생하지만, 만약 사람들이 이 열악한 시스템에 충분한 기술을 가지고 있다면 오류가 줄어들 것이라고 말할 수 있다. 이러한 현상은 모든 운영이 효율적이지 않으며 모든 노력이 업무 수행에 기여하는 것은 아니라는 것을 암시한다. 다시 말해서, 그들은 그들의 지식이나 기술의 부족, 쓸모 없거나 중복된 행동, 또는 정신적 스트레스 때문에 업무가 실제로 그들에게 부과하는 것보다 더 많은 정신적 업무량을 견딜 수 있다. 정신적 스트레스는 "인지적 과정과 에너지적 과정 사이의 균형이 비효율적인 에너지 동원과 부정적인 감정에 의해 방해받는 상태"이다(Gaillard, 1993, 페이지 991). 스트레스 모드에서, 사람들은 상황에 대한 주관적인 평가에 근거하여 긴장감과 위협을 느낀다. 기술이나 지식이 부족하면 정신적 노력이 잘못된 방향으로 흐를 수 있다. 이 두 가지 모두 작동 효율성을 저하시킬 수 있다.
  • 결과적으로, 우리는 정신적 작업량을 효과적이고 비효율적인 두 부분으로 나눈다. 효과적인 워크로드는 효율적이고 올바르게 행동하더라도 작업하는 동안 사람들이 부담해야 하는 워크로드이다. 이는 작업을 수행하는 사람에 관계없이 작업 요구 사항에 의해 생성되는 최소 워크로드 수준이다. 이전 연구에서는 작업 부하로 이해된다며 워크로드의 이 부분은 작업을 직접 수행한다.
  • 이와는 대조적으로 비효율적인 워크로드는 근로자가 피할 수 있는 워크로드이다. 학습과 훈련을 통해 비효율적인 작업량을 줄이고 노력의 방향에 영향을 받을 수 있다. 이 작업은 작업 완료에 직접 기여하지 않는다. 워크로드의 이 부분은 개인이 내부적으로 생성한다. 사람마다 동일한 작업에 대해 서로 다른 양의 비효율적인 작업 부하를 경험한다.
  • 그림 2는 정보 처리 단계 및 각 구성요소의 효과적인 워크로드와 비효율적인 워크로드의 몇 가지 예를 보여줍니다. 유효 워크로드는 처리된 추가 정보의 관점에서 정의된다. 작업 부하는 초당 비트를 사용하여 측정할 수 있다. 그러나 해당되는 경우 다른 조치도 사용할 수 있다. 정신적 워크로드를 리소스라고 하면 비효율적인 워크로드가 리소스를 추가로 사용하게 된다. 작업부하를 정신적 노력이라고 한다면, 비효율적인 작업부하는 필요 이상의 추가 노력이 될 것이다. 작업 부하를 정보의 양이라고 할 경우, 처리한 정보의 양이 비효율적인 작업 부하가 된다. 작업 부하가 성능 시간이라고 하면 비효율적인 작업 부하가 필요한 추가 시간이 된다. 따라서, 어떤 용어로든, 이 모델은 정신적 작업 부하가 어떻게 구성되는지 설명할 수 있다.

Methodology

  •  Experient 1

제안된 가설을 검증하기 위해 두 가지 실험이 고안되었다. 실험 1은 가설 1을 검정하는 데 사용되었습니다. 실험 2는 가설 2, 3, 4를 검정하는 데 사용되었습니다.

3.1.1. 과제 및 참여자. 표 1에 설명된 2 × 2 요인 설계는 가설 1을 검정하는 데 사용되었습니다. 과제는 컴퓨터 화면에서 참가자들에게 제시되는 많은 간단한 산술 질문에 답하는 것으로 구성된다. 작업 수행과 관련된 정신적 작업부하를 변화시키기 위해, 총 4개의 작업이 두 개의 독립 변수, 즉 작업 속도와 작업 크기를 변화시켜 형성된다. 이 실험을 위해 퍼듀 대학의 공대생 60명이 모집되었다. 대학생은 기초적인 산수를 잘하기 때문에 그들의 실제 업무량을 무시할 수 있다고 가정했다.

60명의 학생들이 G1, G2, G3, G4의 4개 그룹으로 무작위로 선발되었고, 각 그룹에는 15명의 학생들이 있었다. 각 참가자는 네 개의 셀 모두에 걸쳐 작업을 수행했으며 각 셀을 한 번만 수행했습니다. 하지만 각 그룹은 다른 세포에서 시작해서 다른 염기서열을 따라 세포를 통과했는데, 이것은 라틴 스퀘어에 의해 결정됩니다. 네 개의 셀이 I, II, III, IV가 되게 하고, 네 개의 그룹에 대한 세트는 G1(II)-G1(III)-G1(III)-G1(IV), G2(II)-G2(III)-G2(IIII), G3(IIIII)-였다. 이 무작위화의 목적은 학습 효과를 탐지하고 제거하는 것이었다. 또한, 바지가 시퀀스를 수행하기 시작하기 전에, 그들은 가족들과 함께 과제를 하기 위한 짧은 훈련을 받았다.

  • Experient 2

이 실험에 사용된 주요 작업은 웹 페이지를 수정하는 것이다. 두 번째 과제는 기본적인 산술 계산이였고 실험 1에서와 같이 퍼듀의 공대생 및 대학원생 60명이 참가자로 모집되었다. 참가자들이 과제를 수행하기 전에 훈련 효과를 줄이기 위한 훈련을 받았다.

실험 2의 레이아웃은 표 2와 같다. 실험 2에서는 단일 작업 및 다중 작업 환경이 모두 사용되었습니다. 멀티태스킹 환경은 시스템 페이싱 환경과 운영자 페이싱 환경으로 더 세분화된다.

 

Results and DIscussions

Test of Hypothesis 1 (Experiment 1)

실험 1은 가설 1을 검정하는 데 사용되었다. 가설 1에서는 전체 워크로드, 평균 워크로드 및 누적 워크로드가 서로 다른 개념이라고 예상한다. 이 가설은 누적 작업 부하가 다른 두 작업 부하와 다르고 평균 작업 부하가 다른 두 작업 부하와 다르다는 것을 입증함으로써 검증될 수 있다. 프레젠테이션 속도의 주요 효과는 전체 워크로드 및 평균 워크로드에서는 크지만 누적 워크로드에서는 크지 않을 것으로 예상되며, 이는 누적 워크로드가 다른 두 워크로드와 다르다는 것을 나타낸다. 또한 작업 규모의 주요 효과는 누적 워크로드와 전체 워크로드에는 크지만 평균 워크로드에는 크지 않을 것으로 예상되며, 이는 평균 워크로드가 다른 두 워크로드와 다르다는 것을 나타낸다.

 

Test of Hypothesis 2 (Experiment 2)

실험 2는 가설 2, 3, 4를 검정하는 데 사용되었습니다. 가설 2는 운영 모델의 예측 값이 측정된 정신적 작업 부하와 높은 상관관계를 가져야 한다고 말한다.

전체 작업 부하에 대해 수행된 회귀 분석 결과, 모델(표 4 참조)이 전체 작업 부하 변동의 42%를 설명하는 것으로 나타났습니다. 각 매개변수에 대한 추가 단계적 분석은 개별 지식이 가장 중요한 요소라는 것을 보여주었다. 이는 전체 작업 부하 변동의 28%와 작업 난이도가 전체 작업 부하 변동의 12%를 설명하였다. 개별 지식과 작업 난이도는 전체 작업 부하 변동의 40%를 공동으로 설명했습니다. 작업 기술에는 1%가 적용되었으며 작업 유형은 작업 부하 변동의 1% 미만을 설명했습니다. 이러한 통계 분석을 통해 개별 지식과 과제 난이도가 TLX 작업 부하 등급에 큰 영향을 미치지만 작업 유형과 운영 기술은 TLX 작업 부하 등급에 큰 영향을 미치지 않는다는 결론을 얻었다.

나머지 두 작업 부하 측정값에 대해 수행된 단계적 회귀 분석에서는 서로 다른 결과가 나타납니다. 작업 부하 성능 측정을 사용하는 모델의 R2가 가장 높습니다(.78). OWL 척도를 사용하는 모형의 R2가 가장 낮습니다. 세 측정값에 대한 R2 비교는 표 5에 요약되어 있다. 결과는 예측된 작업 부하와 성능 데이터 간의 높은 상관 관계 때문에 매우 흥미롭습니다. 즉, 모델이 작업 부하 이외의 운영자 성능을 예측하는 데 유용할 수 있다.

데이터에서 더 많은 정보를 탐색하기 위해 NASA에서 6차원을 확보했습니다.TLX는 제안된 정신적 작업 부하 모델에서 모든 독립 변수에 대한 회귀 분석을 수행하기 위해 종속 변수로 사용되었다. 그 결과는 표 6에 요약되어 있다.

가장 높은 R2(.39)는 일시적 요구와 관련이 있다. 이 결과는 시간 압박이 정신적 작업 부하에 많은 기여를 한다는 우리의 관찰과 일치한다.이는 개발된 운영 모델이 통계적으로 지원된다는 것을 입증했다.

Conclusion and Implications

정신적 작업부하는 인간의 정신적 노력의 결과이거나 그와 동의어이다. 그것은 다른 측면에서 측정될 수 있다. 순간 워크로드는 특정 순간의 워크로드입니다. 평균 워크로드는 시간 단위당 부하 강도 또는 부하를 측정합니다. 누적 워크로드는 경험된 전체 워크로드를 측정합니다. 비효율적인 워크로드는 작업 효율성이 개선된 후 피할 수 있는 워크로드와 관련이 있습니다. 효과적인 워크로드는 작업에 의해 유발되는 피할 수 없는 워크로드입니다. 정신적 작업 부하 정의를 위해 제안된 측정 프레임워크는 매우 중요합니다. 단일 워크로드 값이 아닌 정신적 워크로드 분포를 설명할 수 있습니다. 실험 결과는 전체 정신적 작업 부하가 누적 작업 부하 또는 평균 작업 부하와 다르다는 것을 입증했습니다. 정신 작업부하의 다른 측정의 사용과 관련된 혼란은 정신 작업부하의 측정, 이해 및 해석에 심각한 문제를 일으킬 수 있다. 제안된 개념 모델은 부분적으로 검증되었으며 다른 유형의 작업에 대해 다른 운영 모델을 개발하기 위한 지침으로 사용될 수 있다. 비효율적인 작업 부하 개념은 개별 요인을 모델링하기 위해 정의되었습니다. 작업 관련 요소를 모델링하기 위해 효과적인 작업량을 사용했다. 유효 작업량은 운영자가 경험하는 최소 작업량이며, 해당 작업을 지정해도 변경되지 않습니다. 작업 로드라고도 할 수 있다. 비효율적인 워크로드는 개인의 지식/기술 수준에 따라 크게 영향을 받는다. 운영자가 경험하는 전체 워크로드는 효과적인 워크로드와 비효율적인 워크로드의 합계입니다. 이 모델은 정신적 워크로드의 구성 방법과 워크로드가 높거나 낮은 이유에 대한 특별한 보기를 제공한다. 이 모델은 작업을 찾을 때 비효율적인 작업량과 효과적인 작업량을 함께 고려해야 한다는 것을 암시한다. 비효율적인 작업량을 줄이기 위해 적절한 사람에게 작업을 할당하는 것이 매우 중요합니다. 개발된 운영 모델은 부분적으로 검증되었으며 단일 및 다중 작업 환경 모두에서 시스템 구현 전에 인간의 정신적 작업 부하를 예측하는 데 사용될 수 있다. 작업 복잡성, 작업 유형, 개인 영역 지식 및 운동 기술의 네 가지 요소가 운영 모델에서 고려되었다. 예측 모델은 정신적 작업 부하와 관련된 분산의 42%와 성능 시간과 관련된 분산의 78%를 설명합니다. 작업 복잡성 및 작업 유형과 같은 작업 관련 요소와 도메인 지식과 같은 개별 관련 요소 모두 전반적인 정신적 작업 부하에 상당한 영향을 미친다. 개별 관련 요인은 비효율적인 워크로드에만 영향을 미칩니다. 작업 관련 요인은 효과적인 워크로드와 비효율적인 워크로드 모두에 영향을 미친다. 워크로드는 효과적인 워크로드 또는 비효율적인 워크로드를 통해 제어할 수 있다. 지식 및 규칙 기반 작업의 경우 시스템 페이싱 작업은 운영자에게 예기치 않은 스위치 요건을 많이 가져오기 때문에 시스템 페이싱 시간 압력은 자기 페이싱 시간 압력보다 운영자에게 훨씬 더 높은 정신적 부하를 가져올 수 있다. 실험 결과는 시스템 페이싱 단일 작업의 작업량이 자체 페이싱 다중 작업 조건의 작업량보다 훨씬 더 높다는 것을 보여준다. 시스템 진행 상황에서는 멀티태스크를 피해야 합니다. 다중 작업을 수행할 때 소스에 대한 요구가 충돌하는 경우가 많습니다. 이 경우, 한 소스의 과부하로 인해 작업 부하가 엄청나게 증가한다. 시스템 페이싱 조건에서 멀티태스킹은 동시에 주의가 필요하므로 시스템 페이싱 멀티태스킹 조건에서 주의의 원천이 과중한 부하를 받게 된다.