Preview

Научно-технический вестник информационных технологий, механики и оптики

Расширенный поиск

Вероятностный метод матричной кластеризации с априорным распределением признаков для формирования несмещенной контрольной группы

https://doi.org/10.17586/2226-1494-2025-25-5-999-1001

Аннотация

Предложен метод вероятностной кластеризации матричных данных с использованием априорного распределения признаков и понижения размерности (Singular Value Decomposition, SVD). Метод позволяет выделять в большой контрольной группе кластер, статистически сопоставимый с тестовой группой, что снижает систематические искажения при дальнейшем сравнительном анализе. Показано, что предлагаемый метод позволяет корректно подбирать контрольную группу в случаях, когда известный метод ближайшего соседа дает ложноположительные результаты. Представленный метод применялся для отбора контрольных групп в исследованиях на основе медико-генетической базы данных, проводимых в Национальном медицинском исследовательском центре имени В.А. Алмазова.

Об авторе

Д. А. Усольцев
Институт геномной медицины, Детская больница Нейшенвайд; Университет ИТМО
Соединённые Штаты Америки

Усольцев Дмитрий Андреевич — старший научный сотрудник; аспирант

sc 57279360300

Колумбус, 43205

Санкт-Петербург, 197101



Список литературы

1. Artomov M., Loboda A.A., Artyomov M.N., Daly M.J. Public platform with 39,472 exome control samples enables association studies without genotype sharing // Nature Genetics. 2024. V. 56. N 2. P. 327–335. https://doi.org/10.1038/s41588-023-01637-y

2. Pearce N. Analysis of matched case-control studies // BMJ Online. 2016. V. 352. P. i969. https://doi.org/10.1136/bmj.i969

3. Ghosh A., Ghosh A.K., SahaRay R., Sarkar S. Classification using global and local Mahalanobis distances // Journal of Multivariate Analysis. 2025. V. 207. P. 105417. https://doi.org/10.1016/j.jmva.2025.105417

4. Brunton S.L., Kutz J.N. Singular Value Decomposition (SVD) // Data-Driven Science and Engineering: Machine Learning, Dynamical Systems, and Control. 2019. P. 3–46. https://doi.org/10.1017/9781108380690.002

5. Rovetta A. Raiders of the lost correlation: a guide on using pearson and spearman coefficients to detect hidden correlations in medical sciences // Cureus. 2020. V. 12. N 11. P. e11794. https://doi.org/10.7759/cureus.11794

6. Wang Z., Li G., Hu F., Chi N. Toeplitz concatenated matrix aided ICA algorithm for super-Nyquist multiband CAP VLC systems // Optics Express. 2020. V. 28. N 20. P. 29876–29894. https://doi.org/10.1364/OE.404925

7. Tolkunova K., Usoltsev D., Moguchaia E., Boyarinova M., Kolesova E., Erina A., et al. Transgenerational and intergenerational effects of early childhood famine exposure in the cohort of offspring of Leningrad Siege survivors // Scientific Reports. 2023. V. 13. N 1. P. 11188. https://doi.org/10.1038/s41598-023-37119-8


Рецензия

Для цитирования:


Усольцев Д.А. Вероятностный метод матричной кластеризации с априорным распределением признаков для формирования несмещенной контрольной группы. Научно-технический вестник информационных технологий, механики и оптики. 2025;25(5):999-1001. https://doi.org/10.17586/2226-1494-2025-25-5-999-1001

For citation:


Usoltsev D.A. Probabilistic matrix clustering with feature priors for unbiased control selection. Scientific and Technical Journal of Information Technologies, Mechanics and Optics. 2025;25(5):999-1001. (In Russ.) https://doi.org/10.17586/2226-1494-2025-25-5-999-1001

Просмотров: 13


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2226-1494 (Print)
ISSN 2500-0373 (Online)