These data sets are used for further understanding the underlying biological processes that drive cancer and other diseases. تُستخدم مجموعات البيانات هذه للاستيعاب الأعمق للعمليات البيولوجية التي تتسبب في السرطان والأمراض الأخرى.
A better fitting of the training dataset as opposed to the test dataset usually points to overfitting. عادةً ما يشير التركيب الأفضل لمجموعات البيانات التدريبية بخلاف مجموعة بيانات الاختبار إلى المطابقة الزائد.
Hierarchical axis indexing to work with high-dimensional data in a lower-dimensional data structure. دمج وضم مجموعات البيانات الفهرسة الهرمية وقابلية العمل مع البيانات متعددة الأبعاد في هياكل بيانات ذات عدد أبعاد أقل.
The use of centralized data sources removes the burden for individual organizations to maintain copies of the same data sets. استخدام مصادر بيانات مركزية يزيل العبء عن المؤسسات الفردية للحفاظ على نسخ من مجموعات البيانات نفسها.
Murdock set up a number of foundational data sets, including the Human Relations Area Files, and the Ethnographic Atlas. وأنشأ موردوك عددًا من مجموعات البيانات الأساسية، بما في ذلك ملفات دائرة العلاقات البشرية وأطلس الأجناس البشرية.
These operators are leveraged by applications to ensure that data sets are stored and processed in a topologically correct fashion. تتم الاستفادة من هذه العوامل بواسطة التطبيقات لضمان تخزين مجموعات البيانات ومعالجتها بأسلوب صحيح من الناحية الطوبولوجية.
With the current abundance of massive biological datasets, computational studies have become one of the most important means to biological discovery. ومن خلال التدفق الحالي لمجموعات البيانات البيولوجية الضخمة، فقد أصبحت الدراسات الحاسوبية واحدة من أهم وسائل الاكتشاف البيولوجية.
The "new social historians" (new in the 1960s) use census data and other data sets to study entire populations. يستخدم "علماء التاريخ الاجتماعي الحديث" (حديث في الستينيات من القرن العشرين) بيانات تعداد السكان ومجموعات البيانات الأخرى لدراسة الشعوب بأكملها.
The introduction of computers facilitated the rapid analysis of large data sets used for numerical taxonomy (also called taximetrics or phenetics). وسهل إدخال الحواسيب التحليل السريع لمجموعات البيانات الضخمة المستخدمة في التصنيف العددي (وتسمى أيضا التصنيف الضريبي أو علم الوراثة).
It is important for researchers to make available the datasets they used to each other, or have at least a standard dataset. من المهم للباحثين لإتاحة مجموعات البيانات التي استخدموها لبعضها البعض، أو لديهم ما لا يقل عن مجموعة بيانات القياسية.