DeFs-CBDE: бинарная мутация, управляемая кластеризацией, в многокритериальной дифференциальной эволюции для отбора генов с помощью микрочипов
https://doi.org/10.17586/2226-1494-2025-25-6-1185-1196
Аннотация
Технология ДНК-микрочипов позволяет получать высокоразмерные данные об экспрессии генов, многие из которых не имеют отношения к заболеванию. Эффективный отбор признаков, таким образом, необходим для смягчения «проклятия размерности» и повышения эффективности классификации. В данном исследовании представлен многокритериальный подход к отбору признаков с использованием мутации на основе кластеризации для идентификации компактного набора генов, связанных с заболеванием. Предложенный алгоритм DeFs-CBDE был оценен на четырех наборах данных об экспрессии генов: рак головного мозга, молочной железы, легких и центральной нервной системы, путем отбора информативных подмножеств признаков и их оценки с использованием пяти современных классификаторов, а именно: метода опорных векторов, наивного байесовского алгоритма, метода K-ближайших соседей, дерева решений и случайного леса. Метод DeFs-CBDE достиг 100 % точности на наборе данных о мозге с тремя классификаторами. В наборе данных по легким DeFs-CBDE достиг точности 97,56 % с использованием метода опорных векторов и дерева решений. В наборе данных по молочной железе DeFs-CBDE достиг точности 93,33 %, что очень близко к максимальному результату в 93,81 %. Набор данных по центральной нервной системе оказался самым сложным, где точность составила 91,67 % с использованием. Во всех наборах данных DeFs-CBDE стабильно демонстрировал высокую эффективность классификации.
Ключевые слова
Об авторах
М. Джеллаль СерандиАлжир
Мохамед Джеллаль Серанди, аспирант
Лаборатория LISYS
29000; Маскара
Ф. Буфера
Алжир
Фатма Буфера, кандидат технических наук, профессор, профессор кафедры
Лаборатория LISYS
29000; Маскара
А. Хуари
Алжир
Амина Хуари, PhD, доцент
Лаборатория LISYS
29000; Маскара
sc 57021480300
Ф. Флитти
Объединенные Арабские Эмираты
Фарид Флитти, PhD, доцент
500001; Дубай
sc 24821958500
Список литературы
1. Trunk G.V. A problem of dimensionality: A simple example // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1979. V. PAMI-1. N 3. P. 306–307. doi: 10.1109/tpami.1979.4766926
2. Sab eri-Movahed F., Rostami M., Berahmand K., Karami S., Tiwari P., Oussalah M., Band S.S. Dual regularized unsupervised feature selection based on matrix factorization and minimum redundancy with application in gene selection // Knowledge-Based Systems. 2022. V. 256. P. 109884. doi: 10.1016/j.knosys.2022.109884
3. Deb K. Multi-objective optimisation using evolutionary algorithms: an introduction // Multi-objective Evolutionary Optimisation for Product Design and Manufacturing. 2011. P. 3–34.
4. Che ng Y., Church G.M. Biclustering of expression data // Proc. of the 8<sup>th</sup> International Conference on Intelligent Systems for Molecular Biology. 2000. P. 93–103.
5. Zha ng Y., Gong D., Gao X., Tian T., Sun X. Binary differential evolution with self-learning for multi-objective feature selection // Information Sciences. 2020. V. 507. P. 67–85. doi: 10.1016/j.ins.2019.08.040
6. Ali W., Saeed F. Hybrid filter and genetic algorithm-based feature selection for improving cancer classification in high-dimensional microarray data // Processes. 2023. V. 11. N 2. P. 562. doi: 10.3390/pr11020562
7. Aha dzadeh B., Abdar M., Safara F., Khosravi A., Menhaj M.B., Suganthan P.N. SFE: A simple, fast, and efficient feature selection algorithm for high-dimensional data // IEEE Transactions on Evolutionary Computation. 2023. V. 27. N 6. P. 1896–1911. doi: 10.1109/tevc.2023.3238420
8. Prajapati S., Das H., Gourisaria M.K. Feature selection using differential evolution for microarray data classification // Discover Internet of Things. 2023. V. 3. N 1. P. 12. doi: 10.1007/s43926-023-00042-5
9. Hamla H., Ghanem K. A hybrid feature selection based on fisher score and svm-rfe for microarray data // Informatica. 2024. V. 48. N 1. P. 57–68. doi: 10.31449/inf.v48i1.4759
10. Pau l D., Jain A., Saha S., Mathew J. Multi-objective pso based online feature selection for multi-label classification // Knowledge-Based Systems. 2021. V. 222. P. 106966, doi: 10.1016/j.knosys.2021.106966
11. Han F., Chen W.-T., Ling Q.-H., Han H. Multi-objective particle swarm optimization with adaptive strategies for feature selection // Swarm and Evolutionary Computation. 2021. V. 62. P. 100847. doi: 10.1016/j.swevo.2021.100847
12. Das htban M., Balafar M., Suravajhala P. Gene selection for tumor classification using a novel bio-inspired multi-objective approach // Genomics. 2018. V. 110. N 1. P. 10–17. doi: 10.1016/j.ygeno.2017.07.010
13. Gho sh M., Adhikary S., Ghosh K.K., Sardar A., Begum S., Sarkar R. Genetic algorithm based cancerous gene identification from microarray data using ensemble of filter methods // Medical and Biological Engineering and Computing. 2019. V. 57. N 1. P. 159–176. doi: 10.1007/s11517-018-1874-4
14. St orn R., Price K. Differential evolution: a simple and efficient adaptive scheme for global optimization over continuous spaces // International Computer Science Institute. 1995. V. 95. N 12. P. 1–12.
15. Cha rfaoui Y., Houari A., Boufera F. AMoDeBic: An adaptive multi-objective differential evolution biclustering algorithm of microarray data using a biclustering binary mutation operator // Expert Systems with Applications. 2024. V. 238. Part B. P. 121863, doi: 10.1016/j.eswa.2023.121863
16. Gol dberg D.E. Genetic Algorithms in Search, Optimization and Machine Learning. Addison-Wesley, 1989. 412 p.
17. Deb K., Pratap A., Agarwal S., Meyarivan T. A fast and elitist multi-objective genetic algorithm: NSGA-II // IEEE Transactions on Evolutionary Computation. 2002. V. 6. N 2. P. 182–197. doi: 10.1109/4235.996017
18. Nor onha M.D., Henriques R., Madeira S.C., Zárate L.E. Impact of metrics on biclustering solution and quality : a review // Pattern Recognition. 2022. V. 127. P. 108612. doi: 10.1016/j.patcog.2022.108612
19. Pom eroy S.L., Tamayo P., Gaasenbeek M., Sturla L.M., Angelo M., McLaughlin M.E., et al. Prediction of central nervous system embryonal tumour outcome based on gene expression // Nature. 2002. V. 415. N 6870. P. 436–442. doi: 10.1038/415436a
20. van ’t Veer L.J., Dai H., van de Vijver M.J., He Y.D., Hart A.A.M., Mao M., et al. Gene expression profiling predicts clinical outcome of breast cancer // Nature. 2002. V. 415. N 6871. P. 530–536. doi: 10.1038/415530a
21. Zha o G., Wu Y. Feature subset selection for cancer classification using weight local modularity // Scientific Reports. 2016. V. 6. P. 34759. doi: 10.1038/srep34759
22. Kolberg L., Raudvere U., Kuzmin I., Adler P., Vilo J., Peterson H. g.: Profiler—interoperable web service for functional enrichment analysis and gene identifier mapping (2023 update) // Nucleic Acids Research. 2023. V. 51. N W1. P. W207–W212. doi: 10.1093/nar/gkad347
23. Herbst R.S., Morgensztern D., Boshoff C. The biology and management of non-small cell lung cancer // Nature. 2018. V. 553. N 7689. P. 446–454. doi: 10.1038/nature25183
24. Skoulidis F., Heymach J.V. Co-occurring genomic alterations in non-small-cell lung cancer biology and therapy // Nature Reviews Cancer. 2019. V. 19. N 9. P. 495–509. doi: 10.1038/s41568-019-0179-8
25. Nath S., Mukherjee P. Muc1: a multifaceted oncoprotein with a key role in cancer progression // Trends in Molecular Medicine. 2014. V. 20. N 6. P. 332–342. doi: 10.1016/j.molmed.2014.02.007
Рецензия
Для цитирования:
Джеллаль Серанди М., Буфера Ф., Хуари А., Флитти Ф. DeFs-CBDE: бинарная мутация, управляемая кластеризацией, в многокритериальной дифференциальной эволюции для отбора генов с помощью микрочипов. Научно-технический вестник информационных технологий, механики и оптики. 2025;25(6):1185-1196. https://doi.org/10.17586/2226-1494-2025-25-6-1185-1196
For citation:
Djellal Serandi M., Boufera F., Houari A., Flitti F. DeFs-CBDE: Clustering-guided binary mutation in multi-objective differential evolution for microarray gene selection. Scientific and Technical Journal of Information Technologies, Mechanics and Optics. 2025;25(6):1185-1196. https://doi.org/10.17586/2226-1494-2025-25-6-1185-1196































