Skip to main content

Table 5 Homo sapiens genome: Results (in bytes) for compressing chromosome U via decomposition, i.e. compressing the payload (ρ) into C ρ and compressing the character-case bitstring α into C α

From: A new algorithm for “the LCS problem” with application in compressing genome resequencing data

U |U| Our Scheme GRS GReEn
   |C ρ| \(|\mathbb {L}(C^{\rho })|\) |C α| \(|\mathbb {L}(C^{\alpha })|\) \(|\mathbb {L}(C^{\rho })|+|\mathbb {L}(C^{\alpha })|\) [20] [21]
1 247 249 719 381 577 161 319 755 092 447 919 609 238 1 336 626 1 225 767
2 242 951 149 356 526 153 805 756 823 452 338 606 143 1 354 059 1 272 105
3 199 501 827 284 096 119 348 553 835 343 213 462 561 1 011 124 971 527
4 191 273 063 330 381 137 301 619 981 383 882 521 183 1 139 225 1 074 357
5 180 857 866 259 922 109 768 550 876 331 063 440 831 988 070 947 378
6 170 899 992 265 222 110 544 508 662 310 029 420 573 906 116 865 448
7 158 821 424 292 797 121 289 611 475 355 616 476 905 1 096 646 998 482
8 146 274 826 222 972 93 378 434 420 261 455 354 833 764 313 729 362
9 140 273 252 309 512 132 957 493 024 276 468 409 425 864 222 773 716
10 135 374 737 245 264 103 115 436 272 257 895 361 010 768 364 717 305
11 134 452 384 222 735 92 471 423 687 254 637 347 108 755 708 716 301
12 132 349 534 214 123 88 447 393 764 239 811 328 258 702 040 668 455
13 114 142 980 148 938 62 730 301 116 183 038 245 768 520 598 490 888
14 106 368 585 141 128 57 354 286 839 170 916 228 270 484 791 451 018
15 100 338 915 138 219 58 777 302 957 173 600 232 377 496 215 453 301
16 88 827 254 151 606 62 779 346 282 191 190 253 969 567 989 510 254
17 78 774 742 136 168 57 030 301 837 171 680 228 710 505 979 464 324
18 76 117 153 113 469 47 122 241 437 140 909 188 031 408 529 378 420
19 63 811 651 130 468 53 531 230 673 134 701 188 232 399 807 369 388
20 62 435 964 94 273 38 689 169 584 99 796 138 485 282 628 266 562
21 46 944 323 71 121 28 744 141 387 79 835 108 579 226 549 203 036
22 49 691 432 81 329 33 663 164 026 89 961 123 624 262 443 230 049
X 154 913 754 523 282 196 868 1 533 249 875 026 1 071 894 3 231 776 2 712 153
Y 57 772 954 152 464 57 002 300 287 153 582 210 584 592 791 481 307
M 16 571 64 64(*) 49 49(*) 113 183 127
Sum 3 080 436 051 5 267 656 2 178 095 10 857 634 6 378 609 8 556 704 19 666 791 17 971 030
  1. Bold signifies the best result