Aller au contenu principal
Sujet: Nombreux secteurs défectueux détectés. réparation possible? (Lu 4696 fois) sujet précédent - sujet suivant

Nombreux secteurs défectueux détectés. réparation possible?

hello
voici ce que m'afficher l'outil SMART

unixman@tagomago:/tmp> sudo smartctl -s on -a /dev/sda
[sudo] Mot de passe de root :
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.8.0-1-default] (SUSE RPM)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     WDC WD10JPVX-22JC3T0
Serial Number:    WD-WXM1E669THKM
LU WWN Device Id: 5 0014ee 65cf97ba5
Firmware Version: 01.01A01
User Capacity:    1 000 204 886 016 bytes [1,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Sun Aug 23 10:34:31 2020 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF ENABLE/DISABLE COMMANDS SECTION ===
SMART Enabled.

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                (18300) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 205) minutes.
Conveyance self-test routine
recommended polling time:        (   5) minutes.
SCT capabilities:              (0x7035) SCT Status supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       10616
  3 Spin_Up_Time            0x0027   185   180   021    Pre-fail  Always       -       1733
  4 Start_Stop_Count        0x0032   065   065   000    Old_age   Always       -       35107
  5 Reallocated_Sector_Ct   0x0033   188   188   140    Pre-fail  Always       -       512
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   081   081   000    Old_age   Always       -       14494
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   095   095   000    Old_age   Always       -       5334
191 G-Sense_Error_Rate      0x0032   011   011   000    Old_age   Always       -       89
192 Power-Off_Retract_Count 0x0032   197   197   000    Old_age   Always       -       2394
193 Load_Cycle_Count        0x0032   134   134   000    Old_age   Always       -       200839
194 Temperature_Celsius     0x0022   096   076   000    Old_age   Always       -       51
196 Reallocated_Event_Count 0x0032   189   189   000    Old_age   Always       -       11
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       15

SMART Error Log Version: 1
ATA Error Count: 862 (device log contains only the most recent five errors)
        CR = Command Register [HEX]
        FR = Features Register [HEX]
        SC = Sector Count Register [HEX]
        SN = Sector Number Register [HEX]
        CL = Cylinder Low Register [HEX]
        CH = Cylinder High Register [HEX]
        DH = Device/Head Register [HEX]
        DC = Device Command Register [HEX]
        ER = Error register [HEX]
        ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 862 occurred at disk power-on lifetime: 14493 hours (603 days + 21 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 65 32 1e e5  Error: UNC 8 sectors at LBA = 0x051e3265 = 85865061

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 65 32 1e e5 08      01:59:19.580  READ DMA
  ca 00 08 d0 02 15 ea 08      01:59:16.083  WRITE DMA
  ca 00 08 5d 32 1e e5 08      01:59:16.083  WRITE DMA
  c8 00 20 e0 04 11 e0 08      01:59:16.083  READ DMA

Error 861 occurred at disk power-on lifetime: 14493 hours (603 days + 21 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 60 32 1e e5  Error: UNC 8 sectors at LBA = 0x051e3260 = 85865056

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 5d 32 1e e5 08      01:59:12.592  READ DMA
  c8 00 08 55 32 1e e5 08      01:59:12.591  READ DMA
  c8 00 08 4d 32 1e e5 08      01:59:12.591  READ DMA
  c8 00 08 45 32 1e e5 08      01:59:12.591  READ DMA
  c8 00 08 3d 32 1e e5 08      01:59:12.591  READ DMA

Error 860 occurred at disk power-on lifetime: 14493 hours (603 days + 21 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 80 60 32 1e e5  Error: UNC 128 sectors at LBA = 0x051e3260 = 85865056

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 80 0d 32 1e e5 08      01:59:08.979  READ DMA
  c8 00 80 8d 31 1e e5 08      01:59:08.978  READ DMA
  c8 00 80 0d 31 1e e5 08      01:59:08.978  READ DMA
  c8 00 80 8d 30 1e e5 08      01:59:08.977  READ DMA
  c8 00 80 0d 30 1e e5 08      01:59:08.977  READ DMA

Error 859 occurred at disk power-on lifetime: 14472 hours (603 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 c0 3b 1e e5  Error: UNC 8 sectors at LBA = 0x051e3bc0 = 85867456

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 c0 3b 1e e5 08      01:13:43.762  READ DMA
  ec 00 00 00 00 00 a0 08      01:13:43.757  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 08      01:13:43.757  SET FEATURES [Set transfer mode]

Error 858 occurred at disk power-on lifetime: 14472 hours (603 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 c0 3b 1e e5  Error: UNC 8 sectors at LBA = 0x051e3bc0 = 85867456

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 c0 3b 1e e5 08      01:13:40.280  READ DMA
  ca 00 10 40 f3 50 e8 08      01:13:40.159  WRITE DMA
  c8 00 50 b8 4b 50 e0 08      01:13:40.140  READ DMA

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%     14488         -
# 2  Short offline       Completed without error       00%     14464         -
# 3  Short offline       Completed without error       00%     14424         -
# 4  Extended offline    Interrupted (host reset)      90%     14400         -
# 5  Short offline       Completed without error       00%     14397         -
# 6  Short offline       Completed without error       00%     14392         -
# 7  Short offline       Completed without error       00%     14373         -
# 8  Short offline       Completed without error       00%     14355         -
# 9  Extended offline    Interrupted (host reset)      90%     14329         -
#10  Extended offline    Interrupted (host reset)      90%     14328         -
#11  Short offline       Completed without error       00%     14326         -
#12  Short offline       Completed without error       00%     14305         -
#13  Extended offline    Completed: read failure       90%     14298         85857417
#14  Short offline       Completed without error       00%     14282         -
#15  Short offline       Completed without error       00%     14265         -
#16  Extended offline    Completed: read failure       90%     14253         85857416
#17  Short offline       Completed without error       00%     14244         -
#18  Short offline       Completed: read failure       90%     14219         85862616
#19  Short offline       Completed without error       00%     14200         -
#20  Short offline       Completed without error       00%     14176         -
#21  Extended offline    Completed without error       00%     14160         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.


A noter que j'ai essayé de réparer avec badblocks et également sous Windows (avec HardDiskSentinel) et le diagnostic est franchement pas terrible=l'état du disque est mauvais (17 pour cent) il m'''ordonne" de sauver mes données immédiatement, avant que le système crashe d'ici une trentaine de jours (j'adore quand Windaube me donne des ordres :) )

Bon voila, cher(e)s Susien(ne)s si vous avez quelques idées pour réparer cela ....ou du moins 'amoindrir' le mal!
Gloups, gloups :)

Re : Nombreux secteurs défectueux détectés. réparation possible?

Répondre #1
Hello ;=)

as tu essayé fsck ?
https://www.linode.com/docs/quick-answers/linux/how-to-use-fsck-to-fix-disk-problems/

J'avais trouvé un document qui expliquait mieux mais je retrouve plus, regarde ce genre de choses
https://linoxide.com/linux-how-to/how-to-fix-repair-bad-blocks-in-linux/

Tu as test disk pour sauver, par exemple :
https://korben.info/realiser-limage-dun-disque-dur-testdisk.html

Re : Nombreux secteurs défectueux détectés. réparation possible?

Répondre #2
Yep Manchette!

oui bien sûr que je connais fsck. Il me semble avoir déjà tenté, mais je vais réessayer dès que possible. (Je réinstalle Windows10 là).

Je te tiens au jus, dès que j'ai investigué tes liens!

Testdisk je ne maitrise absolument pas, je préfére donc éviter. Les quelques expériences précédentes ayant éte plus que foireuses.

a+



Re : Nombreux secteurs défectueux détectés. réparation possible?

Répondre #3
au passage si quelqu'un parmi vous sait comment réduire le MULTIZONE ERROR RATE, REALLOCATED SECTOR COUNT ou d'autres attributs SMART en vrac je suis preneur!

Pour répondre à Manchette, il me semble que fsck ne répare que les dommages logiques (donc le système de fichiers, pas la surface du disque en tant que telle)...mais bon c'est en vrac aussi......... alors je vais tester M'sieur Manchette ahah!

Voilou, a+

Re : Nombreux secteurs défectueux détectés. réparation possible?

Répondre #4
Perso, je teste mes DD avec Parted Magic. Quand il n'annonce que l'un d'eux est subclaquant, Je me hâte de tout sauvegarder sur un autre DD. Souvent c'est une question d'heures.

Re : Nombreux secteurs défectueux détectés. réparation possible?

Répondre #5
Je n'en suis pas encore là Sobkowiak. Le pc reste relativement stable,  il y avait ce problème de wifi que j'ai réussi à stabiliser, maintenant il ne me reste plus que ce problème de secteurs.

Et puis les 512 secteurs défaillants ont été réalloués apparemment (l'attribut REALLOCATED SECTOR COUNT dans mon fil #1).
Cela dit j'aimerais bien , soit faire baisser ce chiffre, soit l'un des autres attributs smart (le premier en particulier, ou le MULTIZONE ERROR RATE ).

J"ai essayé différents  scripts basés sur badblocks pour réparer, c'est très aléatoire, parfois ça répare, parfois non.

#!/bin/bash
# script forblocs.sh qui répare automatiquement les blocs entre 117223144 et 117231407.

for i in `seq 117223144 117231407`;
do
clear
echo $i" / 117231407"
sleep 0.04
hdparm --yes-i-know-what-i-am-doing --write-sector $i /dev/sdb
hdparm --read-sector $i /dev/sdb
done
exit

ou celui-ci

    export i=0;
    while true;
    do
      echo -n "$i ";
      if dd if=/dev/sda of=/dev/null count=1 skip=$i 2>/dev/null;
      then  echo OK ;
      else echo KO; hdparm --write-sector $i --yes-i-know-what-i-am-doing /dev/sda ;
      fi;
      let i+=1;
    done

si vous avez des idées pour les améliorer, et bien sûr en concordance avec mon problème, je suis preneur.

Re : Nombreux secteurs défectueux détectés. réparation possible?

Répondre #6
17% du disque est mauvais ? A mon avis, il faudrait effectuer des sauvegardes et changer de disque dur.

Re : Nombreux secteurs défectueux détectés. réparation possible?

Répondre #7
Ce disque est mort. Il est juste bon pour la poubelle. Il en est a 862 erreurs !!!
Avec 5 erreurs en moins de 24 heures.
Il est peut être a bout des secteurs qui peuvent être ré alloué. C'est un coup a tout perdre d'un coup.
C'est prendre beaucoup de risque pour un disque 60€.

Re : Nombreux secteurs défectueux détectés. réparation possible?

Répondre #8
Ce disque est mort. Il est juste bon pour la poubelle. Il en est a 862 erreurs !!!

862? tu vois ça où?
ps=les secteurs évoqués dans le script ne sont pas les miens, c'est un script piqué sur un site web dont je me sers pour réparer quand je dois le faire ...et évidemment je remplace les séquences de réparations (ou les numéros de secteurs, si tu préfères) par les miens.

Le script je le pique là
https://www.aplu.fr/v2/post/2016/01/07/forcer-un-disque-a-reallouer-des-secteurs-defectueux

et pour connaître mes séquences à réparer je le fais de la manière suivante
sudo badblocks -v -b 512 -o badblocks.txt /dev/sda

cela me donne un fichier "badblocks.txt" avec la liste des secteurs corrompus. Je n'ai essayé que les scripts évoqués précédemment pour réparer, avec un résultat aléatoire, et pas (toujours) arrangeant . Donc je voulais savoir si avec les liens donnés par Manchette pourrait être efficace pour mon problème ou pas avant de me lancer.

Merci.

Re : Nombreux secteurs défectueux détectés. réparation possible?

Répondre #9
oui 862 erreurs ok j'ai vu.
Mais j'avais quand même réussi à corriger certaines erreurs, par exemple il y a quelques jours il y avait encore des UNCORRECTABLE SECTORS ou des PENDINGS mais je suis parvenu à les virer.

C'est pour ça que je me dis="Y a de la marge".

512 secteurs ça me parait bien peu à l'échelle d'un disque (qui en comporte des millions) pour être à court de secteurs de réserve.
J'ajouterais que changer de disque dur au moindre pépin n'est pas non plus une solution très économique.

Je demande donc juste un brin de solidarité. Ça sert à ça aussi un forum d'entraide informatique, non?

Re : Nombreux secteurs défectueux détectés. réparation possible?

Répondre #10
Un disque dans cet état c'est pas un petit pépin!!!!
Et puis il est pas tout neuf avec 15000 heures de vol !

Re : Nombreux secteurs défectueux détectés. réparation possible?

Répondre #11
Bonjour,

j'aurais une question:y aurait il moyen de calculer le nombre de secteurs de réserve dont je dispose encore?

une autre question=est que ddrescue pourrait être une bonne solution pour sauver/réparer ce disque?
je me base sur ce tutoriel d'ubuntu que je trouve très bien foutu:

https://doc.ubuntu-fr.org/ddrescue

y aurait il un tutoriel/wiki équivalent pour opensuse?
j'ai trouvé ddrutility qui a l'air pas mal pour le systeme de fichier NTFS, est ce utilisable pour le BTRFS? (mes secteurs corrompus sont en majorité sur la partition racine)

d'autre part, y aurait-il quelque chose sur mon système qui entraînerait cette prolifération de secteurs corrompus, et cette liste qui semble s'allonger? 

sudo fdisk -lu /dev/sda
[sudo] Mot de passe de root :
Disque /dev/sda : 931,53 GiB, 1000204886016 octets, 1953525168 secteurs
Modèle de disque : WDC WD10JPVX-22J
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 4096 octets
taille d'E/S (minimale / optimale) : 4096 octets / 4096 octets
Type d'étiquette de disque : gpt
Identifiant de disque : 6AA06668-663D-49F6-9E11-A657AA357A08

Périphérique      Début        Fin  Secteurs Taille Type
/dev/sda1          2048    1026047   1024000   500M Système EFI
/dev/sda2       1026048   84912127  83886080    40G Système de fichiers Linux
/dev/sda3      84912128  567257087 482344960   230G LVM Linux
/dev/sda4     567257088  567289855     32768    16M Réservé Microsoft
/dev/sda5     667523072 1097019391 429496320 204,8G Système de fichiers Linux
/dev/sda6    1097019392 1937600511 840581120 400,8G Données de base Microsoft
/dev/sda7    1937600512 1953525134  15924623   7,6G Partition d'échange Linux

je donne aussi le résultat du badblocks.txt lorsque c'est terminé

merci

ps: Pascal, je ne veux pas polémiquer mais je trouve ta réaction un peu "sèche". Et désolé, mais moi je pense que c'est encore jouable.


Re : Nombreux secteurs défectueux détectés. réparation possible?

Répondre #13
oui merci Manchette m'avait filé le lien je suis en train d'y jeter un oeil.
Mais est ce que fsck "répare" aussi bien les secteurs logiques que physiques? j'ai vu qu'il marquait les secteurs morts pour qu'ils soient non utilisés à l'avenir, mais je ne sais pas si c'est valable pour les deux cas de figure.
Plus ça va, plus je pense que ddrescue m'aiderait beaucoup plus, dans le cas présent.
Qu'en penses tu?
Il me manque aussi un bon tuto valable pour Suse pour ddrescue.

voici mon fstab, s'il y a des erreurs là-dedans n'hésitez pas à m'en faire part

UUID=1c00bd9d-d77c-49d8-ad5f-926cb11dc4bc  /                       btrfs  defaults                        0  0
UUID=1c00bd9d-d77c-49d8-ad5f-926cb11dc4bc  /.snapshots             btrfs  subvol=/@/.snapshots            0  0
UUID=ee684ebb-dc49-4f24-88b3-6a6e396d0d7c  swap                    swap   defaults                        0  0
UUID=4a3fb1c3-2e6a-41a6-b2c7-95e9f391eb77  /var                    ext4   usrquota,grpquota,data=ordered  0  2
UUID=872ae2d9-4d5f-42df-9426-9eda996dd7d1  /usr/local              ext4   usrquota,grpquota,data=ordered  0  2
UUID=3937376f-ee58-440b-a199-7fe7e7538bbd  /tmp                    ext4   data=ordered                    0  2
UUID=ea5fea0e-e134-4d7d-a181-819944e70a70  /srv                    ext4   usrquota,grpquota,data=ordered  0  2
UUID=1c00bd9d-d77c-49d8-ad5f-926cb11dc4bc  /root                   btrfs  subvol=/@/root                  0  0
UUID=29f5da8d-2609-4c67-b4b5-209bed6b7cc7  /opt                    ext4   usrquota,grpquota,data=ordered  0  2
UUID=8a8a94f6-e02a-42a2-8549-f1bd18badcc6  /home                   xfs    user                            0  0
UUID=1c00bd9d-d77c-49d8-ad5f-926cb11dc4bc  /boot/grub2/x86_64-efi  btrfs  subvol=/@/boot/grub2/x86_64-efi  0  0
UUID=1c00bd9d-d77c-49d8-ad5f-926cb11dc4bc  /boot/grub2/i386-pc     btrfs  subvol=/@/boot/grub2/i386-pc    0  0
UUID=C4AC-90E1                             /boot/efi               vfat   iocharset=utf8,codepage=437,utf8  0  2

Re : Nombreux secteurs défectueux détectés. réparation possible?

Répondre #14
Je n'en pense rien, je n'ai jamais eu à tester l'un ou l'autre. :)

Concernant ddrescue, son fonctionnement est le même sur toutes les distributions, c'est un outil gnu donc standard.
De ce fait (et de manière générale pour les outils gnu) le wiki ubuntu est tout à fait adéquat.


à plus,
oh!rocks