The field of usability evaluation has been widely investigated
over the last years. Several methods have been
proposed both for the evaluation of web applications and
of interactive graphical applications. However, many of
such methods have failed to meet practitioners' expectations
with respect to their usability evaluation goal,
resulting in a low adoption rate. The need has therefore
emerged among HCI researchers to perform appropriate
studies meant to evaluate the usefulness of a usability
evaluation method and the benefits gained by its adoption.
The importance of rigorous studies to validate usability
evaluation methods was first claimed by Gray and Salzman
in [6]. The authors reviewed several experimental studies
performed on usability evaluation methods and concluded
that most suffer from the lack of meticulousness in proving
the statistical validity of the achieved results. Similar
claims were later discussed by Hartson et al., who also
addressed the lack of standard criteria and a clear understanding
of the factors being measured as major problems
when comparing different usability evaluation methods
[8]. A few years later Hornbæk summarized current
practice of measuring usability and critically reviewed that
practice, after reviewing usability measures employed in
180 studies published in core HCI journals and proceedings
[9]. The goal of their study was to understand what
2 R. Cassino et al. / Journal of Visual Languages and Computing 28 (2015) 1–22
challenges should be faced to improve the validity and
reliability of usability measures. In the specific field of web
engineering, Fernandez et al. presented an extensive
analysis of the usability evaluation methods employed
over the last years to evaluate web applications [5]. Their
systematic study was mainly intended to examine how the
analyzed usability evaluation methods relate to the web
development process. Recently, the same researchers have
presented the results of the empirical validation of a
usability inspection method for model-driven web development,
comparing it with heuristic evaluation performed
in early stages of web development [4]. As a result of the
qualitative analysis performed, they conclude that, given
the nature of the proposed Web Usability Evaluation
Process (WUEP), which relies on different metrics to be
collected throughout the development process, most of
the calculation tasks could be profitably automated.
Hvannberga et al. proposed a framework to compare
different evaluation methods and described a case study
where the framework is used to evaluate effectiveness,
efficiency and inter-evaluator reliability of two sets of
heuristics, Nielsen's heuristics and the cognitive principles
of Gerhardt-Powals [10]. The same experiment was used to
compare paper based methods and web tool based methods
for usability problem reporting. The results suggest
that a web tool for easy access and effective management
of data captured during evaluation may yield more reliable
results, especially supporting collaboration among evaluators
in remote settings [9]. Similar claims are supported by
Palanque et al., who described an approach that combines
different techniques including formal analysis of models,
simulation and analysis of log data in a model-based
environment [19]. The log data at model level can be used
not only to identify usability problems but also to identify
where to operate changes to these models in order to fix
usability problems. Some researchers have proposed the
use of formal grammar specifications to support the
designer in modeling and code generation of the GUI
while satisfying usability parameters. In [2], a methodology
was presented to specify and evaluate interactive
visual environments, in particular web interfaces, based
on the SR-Action Grammars formalism. A bottom-up
approach is described to aid the designer to develop
graphical applications that automatically respect a significant
number of usability rules before the software is
released and tested by standard methods, by means of
checks performed at a high level of abstraction. However,
similar solutions require a deep knowledge of the formalism
to perform usability checks of the application, and are
not conceived to verify applications already developed
using a top-down approach.
A common aspect of all the previous studies is that they
focus on usability evaluation methods mainly applied at
early stages of design and development for formative
usability evaluation activities. Such methods are therefore
meant to improve the evaluated artefact before the implementation
phase. The empirical study we present in the
paper is instead referred to an automatic evaluation
method intended for a summative usability evaluation.
Ivory and Hearst investigated the level of automation
offered by a large number of existing WIMP and Web
interfaces usability evaluation methods and discovered
that some methods successfully automate aspects of
usability evaluation such as capture, analysis, or critique
activities [11]. They claim that automation of usability
evaluation, as a proper complement to standard evaluation
techniques, may yield several advantages. It may reduce
time and cost required for evaluation activities, may
increase consistency of uncovered errors, may help predicting
time and error costs across design, may reduce the
level of expertise required to evaluators, and may increase
the coverage of evaluated features.
Several techniques have been explicitly conceived for
automatic discovery of usability faults. Reverse engineering
techniques have been implemented in order to extract
static properties of the graphical interfaces, semiautomatic
tools are then delegated to analyze the properties
of the several GUI components [1,7,12-16]. To evaluate
the efficiency of the interactive aspects, most of the
systems extract test cases of the typical activities and
tester users are assigned to the evaluation.
A number of methods for usability evaluation rely on
the availability of the source code of an application and/or
its interface. The process described in [3] analyzes the
source code of a visual application, the design model of its
interface, the graphical aspects and the interaction
mechanisms implemented in each frame, panel and/or
page of the system, to produce a report of the quantitative
evaluation of heuristic factors.
One limitation of the automated tools previously examined
is that they use a back-side approach, which derives
from the analysis of the “hidden” side (e.g., source code
and logs) of the system. If the source code is not available,
it is very difficult to perform an automatic evaluation by
means of the techniques above.
With reference to our present research goal, the revised
literature reveals that the efficacy of the mentioned
techniques has been primarily verified through testing
activities, observing the effects of their adoption on real
interface prototypes, whereas rigorous empirical validation
procedures that could strengthen and generalize the
testing outcomes are still missing. The results of the
empirical validation we present are intended to be a first
step towards bridging that gap.
ด้านการประเมินผลการใช้งานที่ได้รับการตรวจสอบกันอย่างแพร่หลายในช่วงหลายปีที่ผ่านมา วิธีการหลายคนได้รับการเสนอชื่อทั้งสำหรับการประเมินผลของการใช้งานเว็บและการใช้งานกราฟิกแบบโต้ตอบ แต่หลายวิธีการดังกล่าวจะยังไม่ได้ตอบสนองความต้องการผู้ปฏิบัติ'ที่เกี่ยวกับการประเมินผลการใช้งานเป้าหมายของพวกเขาส่งผลให้อัตราการยอมรับในระดับต่ำ จำเป็นที่จะต้องได้จึงโผล่ออกมาระหว่างนักวิจัย HCI ในการดำเนินการที่เหมาะสมในการศึกษาหมายถึงการประเมินประโยชน์ของการใช้งานที่วิธีการประเมินผลและผลประโยชน์ที่ได้รับจากการรับเลี้ยงบุตรบุญธรรม. ความสำคัญของการศึกษาอย่างเข้มงวดในการตรวจสอบการใช้งานวิธีการประเมินผลก็อ้างว่าเป็นครั้งแรกโดยสีเทาและ Salzman ใน [6 ] ผู้เขียนมีการทบทวนการศึกษาทดลองหลายดำเนินการเกี่ยวกับการใช้งานวิธีการประเมินผลและสรุปได้ว่าส่วนใหญ่ต้องทนทุกข์ทรมานจากการขาดความปราณีตในการพิสูจน์ความถูกต้องทางสถิติของผลการประสบความสำเร็จ ที่คล้ายกันเรียกร้องได้รับการกล่าวถึงในภายหลังโดยฮาร์ทสัน et al., ที่ยังแก้ไขการขาดของเกณฑ์มาตรฐานและความเข้าใจที่ชัดเจนของปัจจัยที่มีการวัดเป็นปัญหาที่สำคัญเมื่อเปรียบเทียบกับการใช้งานวิธีการประเมินผลที่แตกต่างกัน[8] ไม่กี่ปีต่อHornbækสรุปในปัจจุบันการปฏิบัติของการวัดการใช้งานและมีการทบทวนอย่างยิ่งว่าการปฏิบัติหลังจากการทบทวนมาตรการที่ใช้ในการใช้งาน180 การศึกษาตีพิมพ์ในวารสาร HCI หลักและดำเนินการตามกฎหมาย[9] เป้าหมายของการศึกษาของพวกเขาคือการเข้าใจในสิ่งที่2 อาร์กาสิโน et al, / วารสารภาพภาษาและคอมพิวเตอร์ที่ 28 (2015) 1-22 ความท้าทายที่ควรจะต้องเผชิญกับการปรับปรุงความถูกต้องและความน่าเชื่อถือของมาตรการการใช้งาน ในสาขาที่เฉพาะเจาะจงของเว็บวิศวกรรมเฟอร์นันเด et al, นำเสนอที่ครอบคลุมการวิเคราะห์วิธีการประเมินผลการใช้งานการจ้างงานในช่วงหลายปีที่ผ่านมาในการประเมินการใช้งานเว็บ[5] ของพวกเขาระบบการศึกษาส่วนใหญ่ก็ตั้งใจที่จะตรวจสอบว่าวิธีการประเมินผลการใช้งานที่เกี่ยวข้องกับการวิเคราะห์เว็บกระบวนการพัฒนา เมื่อเร็ว ๆ นี้นักวิจัยเดียวกันได้นำเสนอผลการตรวจสอบเชิงประจักษ์หนึ่งของวิธีการตรวจสอบการใช้งานในการพัฒนาเว็บแบบขับเคลื่อน, เปรียบเทียบกับการประเมินผลการดำเนินการแก้ปัญหาในขั้นตอนแรกของการพัฒนาเว็บ [4] อันเป็นผลมาจากการวิเคราะห์เชิงคุณภาพดำเนินการพวกเขาสรุปว่าได้รับลักษณะของการใช้งานเว็บที่นำเสนอการประเมินผลกระบวนการ(WUEP) ซึ่งอาศัยอยู่กับตัวชี้วัดที่แตกต่างกันที่จะเก็บรวบรวมตลอดกระบวนการพัฒนามากที่สุดของงานคำนวณอัตโนมัติอาจจะมีผลกำไรHvannberga et al, เสนอกรอบการทำงานเพื่อเปรียบเทียบวิธีการประเมินผลที่แตกต่างกันและอธิบายกรณีศึกษาที่กรอบจะใช้ในการประเมินประสิทธิผลประสิทธิภาพและความน่าเชื่อถือระหว่างประเมินของสองชุดของการวิเคราะห์พฤติกรรม, การวิเคราะห์พฤติกรรมนีลเซ่นและความรู้ความเข้าใจในหลักการของ Gerhardt-Powals [10] การทดลองเดียวกันถูกใช้ในการเปรียบเทียบวิธีการใช้กระดาษและเครื่องมือบนเว็บวิธีการที่ใช้ในการแก้ไขปัญหาการใช้งานการรายงาน ผลการวิจัยแนะนำว่าเครื่องมือเว็บสำหรับการเข้าถึงง่ายและการจัดการที่มีประสิทธิภาพของข้อมูลที่ถูกจับระหว่างการประเมินอาจให้น่าเชื่อถือมากขึ้นผลโดยเฉพาะอย่างยิ่งการสนับสนุนความร่วมมือระหว่างการประเมินผลในการตั้งค่าระยะไกล[9] การเรียกร้องที่คล้ายกันได้รับการสนับสนุนโดยPalanque et al., ที่อธิบายวิธีการที่รวมเทคนิคที่แตกต่างกันรวมถึงการวิเคราะห์อย่างเป็นทางการของรุ่นการจำลองและการวิเคราะห์ข้อมูลการเข้าสู่ระบบในรูปแบบตามสภาพแวดล้อมที่[19] ข้อมูลเข้าสู่ระบบในระดับรูปแบบสามารถนำมาใช้ไม่เพียง แต่เพื่อแจ้งปัญหาการใช้งาน แต่ยังระบุว่าจะดำเนินการเปลี่ยนแปลงรูปแบบเหล่านี้เพื่อที่จะแก้ไขปัญหาการใช้งาน นักวิจัยบางคนได้นำเสนอการใช้งานของข้อกำหนดไวยากรณ์อย่างเป็นทางการที่จะสนับสนุนนักออกแบบในการสร้างแบบจำลองและการสร้างรหัสของกุยในขณะที่ความพึงพอใจของพารามิเตอร์การใช้งาน ใน [2] ซึ่งเป็นวิธีการที่ถูกนำเสนอในการระบุและประเมินผลการโต้ตอบสภาพแวดล้อมที่ภาพในอินเตอร์เฟซเว็บโดยเฉพาะอย่างยิ่งตามที่Grammars SR-การกระทำพิธี ด้านล่างขึ้นวิธีการคือการอธิบายที่จะช่วยให้นักออกแบบในการพัฒนาโปรแกรมกราฟิกที่เคารพโดยอัตโนมัติอย่างมีนัยสำคัญจำนวนของกฎการใช้งานซอฟแวร์ก่อนที่จะมีการเปิดตัวและการทดสอบโดยวิธีมาตรฐานโดยใช้วิธีการตรวจสอบการดำเนินการในระดับสูงของนามธรรม อย่างไรก็ตามการแก้ปัญหาที่คล้ายกันต้องมีความรู้ลึกของเป็นพิธีที่จะดำเนินการตรวจสอบการใช้งานของแอพลิเคชันและไม่คิดที่จะตรวจสอบการใช้งานการพัฒนาแล้วโดยใช้วิธีการจากบนลงล่าง. ลักษณะทั่วไปของทุกศึกษาก่อนหน้านี้ก็คือพวกเขามุ่งเน้นไปที่การประเมินผลการใช้งานวิธีการใช้เป็นหลักในช่วงแรกของการออกแบบและการพัฒนาสำหรับการก่อสร้างกิจกรรมการประเมินผลการใช้งาน วิธีการดังกล่าวจึงหมายถึงการปรับปรุงสิ่งประดิษฐ์ประเมินก่อนที่จะดำเนินการตามขั้นตอน การศึกษาเชิงประจักษ์เรานำเสนอในกระดาษแทนเรียกว่าการประเมินผลโดยอัตโนมัติวิธีการไว้สำหรับการประเมินผลการใช้งานปลายทาง. ไอวอรี่และเฮิร์สต์ตรวจสอบระดับของระบบอัตโนมัติที่นำเสนอโดยจำนวนมากของคนสามัญที่มีอยู่และเว็บการเชื่อมต่อวิธีการประเมินผลการใช้งานและการค้นพบว่าวิธีการบางอย่างประสบความสำเร็จในการทำงานโดยอัตโนมัติแง่มุมของการประเมินผลการใช้งานเช่นการจับภาพการวิเคราะห์หรือวิจารณ์กิจกรรม[11] พวกเขาเรียกร้องระบบอัตโนมัติของการใช้งานที่ประเมินผลเป็นส่วนประกอบที่เหมาะสมในการประเมินผลมาตรฐานเทคนิคอาจให้ข้อดีหลายประการ มันอาจจะช่วยลดเวลาและค่าใช้จ่ายที่จำเป็นสำหรับกิจกรรมการประเมินผลอาจเพิ่มความสอดคล้องของข้อผิดพลาดแดงอาจช่วยให้การคาดการณ์เวลาและค่าใช้จ่ายข้อผิดพลาดที่ผ่านการออกแบบอาจลดระดับของความเชี่ยวชาญที่จำเป็นในการประเมินผลและอาจเพิ่มความคุ้มครองของคุณสมบัติการประเมิน. เทคนิคหลายมี รับรู้สึกอย่างชัดเจนสำหรับการค้นหาโดยอัตโนมัติของความผิดพลาดในการใช้งาน วิศวกรรมย้อนกลับเทคนิคมีการดำเนินการเพื่อที่จะดึงคุณสมบัติคงที่ของอินเตอร์เฟซแบบกราฟิกที่กึ่งอัตโนมัติเครื่องมือจากนั้นได้รับการแต่งตั้งในการวิเคราะห์คุณสมบัติขององค์ประกอบGUI หลาย [1,7,12-16] เพื่อประเมินประสิทธิภาพในด้านการโต้ตอบมากที่สุดของระบบสารสกัดจากกรณีทดสอบของกิจกรรมทั่วไปและผู้ใช้ทดสอบได้รับมอบหมายให้ประเมินผล. จำนวนของวิธีการในการประเมินผลการใช้งานขึ้นอยู่กับความพร้อมของรหัสที่มาของแอพลิเคชันและ / หรือ อินเตอร์เฟซ กระบวนการที่อธิบายไว้ใน [3] วิเคราะห์รหัสแหล่งที่มาของโปรแกรมภาพรูปแบบการออกแบบของอินเตอร์เฟซในด้านกราฟิกและการปฏิสัมพันธ์กลไกการดำเนินการในแต่ละเฟรมแผงและ/ หรือหน้าของระบบการผลิตรายงานที่ปริมาณการประเมินผลของปัจจัยการแก้ปัญหา. หนึ่งในข้อ จำกัด ของเครื่องมืออัตโนมัติตรวจสอบก่อนหน้านี้ก็คือพวกเขาใช้วิธีการกลับด้านซึ่งล้วนมาจากการวิเคราะห์ของ"ซ่อน" ด้าน (เช่นรหัสแหล่งที่มาและบันทึก) ของระบบ ถ้าซอร์สโค้ดไม่สามารถใช้มันเป็นเรื่องยากมากที่จะดำเนินการประเมินผลอัตโนมัติโดยวิธีการของเทคนิคดังกล่าวข้างต้น. ตามที่เป้าหมายของการวิจัยในปัจจุบันของเรา, การปรับปรุงวรรณกรรมแสดงให้เห็นว่าการรับรู้ความสามารถของคนกล่าวถึงเทคนิคที่ได้รับการตรวจสอบส่วนใหญ่ผ่านการทดสอบกิจกรรมสังเกตผลกระทบของการยอมรับของพวกเขาในความเป็นจริงต้นแบบอินเตอร์เฟซในขณะที่การตรวจสอบเชิงประจักษ์อย่างเข้มงวดขั้นตอนที่จะสร้างความเข้มแข็งและกล่าวสรุปผลการทดสอบยังคงหายไป ผลที่ได้จากการตรวจสอบเชิงประจักษ์เรานำเสนอมีความตั้งใจที่จะเป็นครั้งแรกขั้นตอนต่อเชื่อมช่องว่างที่
การแปล กรุณารอสักครู่..

ด้านการประเมินผลการใช้งานได้ถูกใช้กันอย่างแพร่หลาย
ปีล่าสุด หลายวิธีได้ถูก
เสนอทั้งการประเมินผลการใช้งานเว็บและ
ของโปรแกรมกราฟิกแบบโต้ตอบ อย่างไรก็ตาม , หลาย
วิธีการดังกล่าวมีไม่เพียงพอที่จะประกอบความคาดหวัง
ด้วยการการใช้งานการประเมินเป้าหมาย
ส่งผลให้อัตราการยอมรับน้อย ต้องมีดังนั้น
เกิดขึ้นในหมู่นักวิจัยทำการศึกษาโดยเหมาะสม
ตั้งใจเพื่อประเมินประโยชน์ของการใช้งาน
วิธีการประเมินผลและประโยชน์ที่ได้รับจากการรับเลี้ยงบุตรบุญธรรม
ความสำคัญของการศึกษาเพื่อตรวจสอบอย่างเข้มงวดการประเมินผลการใช้งาน
เป็นครั้งแรกโดยอ้างว่าสีเทาและซอลส์เมิน
[ 6 ] ผู้เขียนได้ศึกษาทดลองใช้วิธีการประเมินผลการใช้งานหลาย
และสรุปที่ส่วนใหญ่ประสบจากการขาดของความประณีตในการพิสูจน์
ความถูกต้องทางสถิติของบรรลุผล การเรียกร้องที่คล้ายกัน
ก็กล่าวถึงฮาร์ตสัน et al . , ที่ยัง
อยู่ขาดมาตรฐานและความเข้าใจ
ของปัจจัยที่ถูกวัดเป็นหลักปัญหา
เมื่อเปรียบเทียบการใช้งานที่แตกต่างกันวิธีการประเมินผล
[ 8 ] ไม่กี่ปีต่อมา hornb æ K
สรุปปัจจุบันการฝึกทบทวนการปฏิบัติการวัดการใช้งานและวิกฤตที่
หลังจากที่ตรวจสอบการใช้งานมาตรการที่ใช้ในการเผยแพร่การศึกษา
180 หลัก HCI วารสารและการดำเนินการ
[ 9 ] เป้าหมายของการศึกษาคือ เพื่อเข้าใจสิ่งที่
2 R . Cassino et al . / วารสารภาษาภาพและคอมพิวเตอร์ 28 ( 2015 ) 1 – 22
ท้าทายควรจะเผชิญเพื่อปรับปรุงความถูกต้องและความเชื่อถือได้ของการวัด
การใช้งานในเขตข้อมูลที่เฉพาะเจาะจงของวิศวกรรมเว็บ
, Fernandez et al . นำเสนอการวิเคราะห์อย่างละเอียดของวิธีการประเมินผลการใช้งาน
3
ปีสุดท้ายเพื่อประเมินการใช้งาน [ 5 ] เว็บ ศึกษาระบบของพวกเขามีวัตถุประสงค์หลักเพื่อศึกษาวิธีการ
วิเคราะห์วิธีการประเมินผลการใช้งานที่เกี่ยวข้องกับเว็บ การพัฒนากระบวนการ เมื่อเร็วๆ นี้ นักวิจัยได้
เหมือนกันเสนอผลของการตรวจสอบเชิงประจักษ์ของวิธีการตรวจสอบการใช้งาน เพื่อผลักดันการพัฒนาแบบจำลอง
เว็บ
สำหรับการเปรียบเทียบกับการประเมินในขั้นตอนแรกของการพัฒนาเว็บ [ 4 ] ผลของการวิเคราะห์เชิงคุณภาพ (
,
พวกเขาสรุปว่า ให้ธรรมชาติของการนำเสนอเว็บการใช้งานการประเมินผลกระบวนการ ( wuep
) ซึ่งอาศัยตัวชี้วัดที่แตกต่างกันที่จะ
เก็บตลอดกระบวนการพัฒนา , ที่สุดของการคำนวณสามารถมีผลงาน
แบบอัตโนมัติ hvannberga et al . ได้เสนอกรอบการเปรียบเทียบและอธิบายวิธีการประเมินที่แตกต่างกัน
กรอบกรณีศึกษาที่ใช้ประเมินประสิทธิผล ประสิทธิภาพและประเมินความน่าเชื่อถือของอินเตอร์
สองชุดของอักษร , นีลเส็นเป็นอักษรและหลักการทางปัญญา
ของ เกอร์ฮาร์ต powals [ 10 ] การทดลองใช้วิธีการเดียวกัน
เปรียบเทียบกระดาษตามเว็บตามเครื่องมือและวิธีการ
เพื่อรายงานปัญหาการใช้งาน พบ
ที่เว็บเครื่องมือสำหรับการเข้าถึงที่ง่ายและการจัดการที่มีประสิทธิภาพของข้อมูลที่บันทึกในการประเมินอาจให้ผลลัพธ์ที่เชื่อถือได้
เพิ่มเติม โดยเฉพาะอย่างยิ่งการสนับสนุนความร่วมมือระหว่างผู้ประเมิน
ในการตั้งค่าระยะไกล [ 9 ] การเรียกร้องที่คล้ายกันได้รับการสนับสนุนโดย
palanque et al . , ที่อธิบายวิธีการที่รวม
เทคนิคต่าง ๆ รวมทั้งการวิเคราะห์อย่างเป็นทางการของรุ่น
จำลองและการวิเคราะห์ข้อมูลเข้าสู่ระบบในสภาพแวดล้อมสำหรับ
[ 19 ] บันทึกข้อมูลในระดับรุ่นที่สามารถใช้ไม่เพียง แต่ระบุปัญหาการใช้งาน
แต่ยังหาที่ใช้เปลี่ยนแปลงรูปแบบเหล่านี้ในการแก้ไข
ปัญหาการใช้งาน นักวิจัยบางคนได้เสนอ
การใช้ไวยากรณ์สเปคอย่างเป็นทางการเพื่อสนับสนุน
ออกแบบในการจำลองและรหัสรุ่นของ GUI
ในขณะที่ความพึงพอใจของการใช้งาน ใน [ 2 ] วิธีการ
ถูกเสนอเพื่อระบุและประเมินสภาพแวดล้อมแบบโต้ตอบในอินเตอร์เฟซเว็บภาพ
โดยเฉพาะ โดยใน SR ไวยากรณ์การกระทำแบบ . ต้องเข้าหาอธิบายเพื่อช่วย
ออกแบบพัฒนากราฟิก โปรแกรมที่โดยอัตโนมัติเคารพจำนวน
กฎการใช้งานก่อนซอฟต์แวร์
ออกและทดสอบโดยวิธีมาตรฐานโดยใช้วิธีการ
ตรวจสอบดำเนินการในระดับนามธรรม อย่างไรก็ตาม
โซลูชั่นที่คล้ายคลึงกันต้องใช้ความรู้ลึกของพิธี
แสดงการใช้งานการตรวจสอบของโปรแกรม และไม่ได้รู้สึกเพื่อตรวจสอบการใช้งานพัฒนา
แล้วโดยใช้วิธีการแบบบนลงล่าง .
ด้านทั่วไปของการศึกษาที่พวกเขามุ่งเน้นไปที่วิธีการประเมินผลการใช้งาน
ส่วนใหญ่ใช้ในขั้นตอนแรกของการออกแบบและพัฒนาสำหรับการใช้งานก่อสร้าง
ประเมินผลกิจกรรม วิธีการดังกล่าวจึง
หมายถึงการปรับปรุงการประเมินก่อนการใช้สิ่งประดิษฐ์
เฟส ผลการศึกษาเชิงประจักษ์ใน
เราปัจจุบันกระดาษที่ถูกเรียกแทนเพื่อประเมินวิธีการอัตโนมัติ
ไว้สำหรับการประเมินผลการใช้งานหลัก .
งาช้างและ Hearst ตรวจสอบระดับของระบบอัตโนมัติ
เสนอ โดยตัวเลขขนาดใหญ่ของคนอ่อนแอที่มีอยู่และการใช้งานเว็บ
) วิธีการประเมินผล และพบว่าบางวิธีที่ประสบความสำเร็จด้านการประเมินความสามารถในการใช้งานได้โดยอัตโนมัติ เช่น จับ
หรือ วิจารณ์ วิเคราะห์ กิจกรรม [ 11 ]พวกเขาอ้างว่า ระบบอัตโนมัติของการประเมินผลการใช้งาน
เป็นส่วนเติมเต็มที่เหมาะสมมาตรฐานเทคนิคการประเมิน
อาจให้ผลประโยชน์หลาย มันอาจจะช่วยลดเวลาและค่าใช้จ่ายที่จำเป็นสำหรับกิจกรรม
เพิ่มความสอดคล้องของการประเมิน อาจพบข้อผิดพลาดอาจช่วยทำนาย
ค่าใช้จ่ายเวลาและข้อผิดพลาดในการออกแบบ อาจลดระดับของความเชี่ยวชาญ ต้องชม
และอาจเพิ่มความครอบคลุมของการประเมินคุณสมบัติ .
หลายเทคนิคได้รับอย่างชัดเจนไม
ค้นพบโดยอัตโนมัติข้อผิดพลาดการใช้งาน เทคนิควิศวกรรม
กลับถูกพัฒนาเพื่อดึง
คุณสมบัติคงที่ของอินเตอร์เฟซแบบกราฟิกเครื่องมือกึ่งอัตโนมัติ
จากนั้นได้มอบหมายให้วิเคราะห์คุณสมบัติของส่วนประกอบ GUI หลาย
[ 1,7,12-16 ] เพื่อประเมิน
ประสิทธิภาพของลักษณะแบบโต้ตอบมากที่สุดของกรณีทดสอบของระบบแยก
กิจกรรมทั่วไปและผู้ทดสอบจะได้รับมอบหมายให้ประเมิน .
จํานวนของวิธีการประเมินผลการใช้งานพึ่งพา
ความพร้อมของรหัสที่มาของโปรแกรมและ / หรือ
อินเตอร์เฟซของมัน กระบวนการที่อธิบายไว้ใน [ 3 ] วิเคราะห์
รหัสแหล่งที่มาของโปรแกรมภาพ , การออกแบบรูปแบบอินเตอร์เฟซของมัน
,ด้านกราฟิกและปฏิสัมพันธ์
กลไกดำเนินการในแต่ละเฟรม , แผงและ / หรือ
หน้าของระบบผลิตรายงานการประเมินเชิงปริมาณของปัจจัยนี้
.
หนึ่งข้อจำกัดของเครื่องมือทดสอบอัตโนมัติก่อนหน้านี้
คือว่าพวกเขาใช้ด้านหลังวิธีการซึ่งได้มาจากการวิเคราะห์ของ
" ซ่อน " ด้าน ( เช่นรหัสแหล่ง
และบันทึก ) ของระบบถ้าโค้ดไม่สามารถใช้ได้
มันเป็นเรื่องยากมากที่จะทำการประเมินผลโดยอัตโนมัติ
วิธีการเทคนิคข้างต้น .
อ้างอิงงานวิจัยของเราปัจจุบันเป้าหมาย , แก้ไข
วรรณกรรมพบว่า ประสิทธิภาพของเทคนิคดังกล่าวได้รับการยืนยันผ่านหลัก
กิจกรรมการทดสอบสังเกตผลของการยอมรับของ ต้นแบบอินเตอร์เฟซจริง
,ในขณะที่เคร่งครัดการตรวจสอบเชิงประจักษ์ขั้นตอนที่สามารถเสริมสร้างและอนุมาน
การทดสอบผลลัพธ์จะยังคงหายไป ผลลัพธ์ของการตรวจสอบเชิงประจักษ์
เราปัจจุบันมีวัตถุประสงค์ที่จะเป็นคนแรก
ขั้นตอนต่อเชื่อมช่องว่างที่
การแปล กรุณารอสักครู่..
